No se trata de una pauta para repetir sino diferentes ejemplos para daros ideas e inspiraros.
Se ha seleccionado un conjunto de datos del National Highway Traffic Safety Administration. El sistema de informes de análisis de mortalidad fue creado en los Estados Unidos por la National Highway Traffic Safety Administration para proporcionar una medida global de la seguridad en las carreteras. (Fuente Wikipedia). Los datos pertenecen al año 2020. Se trata de un conjunto de registros de accidentes que recogen datos significativos que los describen. Todos los accidentes tienen alguna víctima mortal como mínimo. El objetivo analítico que tenemos en mente es entender que hace que un accidente sea grave y que quiere decir que sea grave. https://www.nhtsa.gov/crash-data-systems/fatality-analysis-reporting-system
Queremos hacer una primera aproximación al conjunto de datos escogido y responder a las preguntas más básicas: ¿Cuánto registros tiene? ¿Cuántas variables? ¿De qué tipología son? ¿Cómo se distribuyen los valores de las variables? ¿Hay problemas con los datos, por ejemplo, campos vacíos? ¿Puedo intuir ya el valor analítico de los datos? ¿Qué primeras conclusiones puedo extraer?
El primer paso para realizar un análisis exploratorio es cargar el fichero de datos.
path = 'accident.CSV'
accidentData <- read.csv(path, row.names=NULL)
Verificamos la estructura del juego de datos principal. Vemos el número de columnas que tenemos y ejemplos de los contenidos de las filas.
structure = str(accidentData)
## 'data.frame': 35766 obs. of 81 variables:
## $ STATE : int 1 1 1 1 1 1 1 1 1 1 ...
## $ STATENAME : chr "Alabama" "Alabama" "Alabama" "Alabama" ...
## $ ST_CASE : int 10001 10002 10003 10004 10005 10006 10007 10008 10009 10010 ...
## $ VE_TOTAL : int 1 4 2 1 1 2 1 2 2 2 ...
## $ VE_FORMS : int 1 4 2 1 1 2 1 2 2 2 ...
## $ PVH_INVL : int 0 0 0 0 0 0 0 0 0 0 ...
## $ PEDS : int 0 0 0 0 0 0 1 0 0 0 ...
## $ PERSONS : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERMVIT : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERNOTMVIT : int 0 0 0 0 0 0 1 0 0 0 ...
## $ COUNTY : int 51 73 117 15 37 103 73 25 45 95 ...
## $ COUNTYNAME : chr "ELMORE (51)" "JEFFERSON (73)" "SHELBY (117)" "CALHOUN (15)" ...
## $ CITY : int 0 350 0 0 0 0 330 0 0 1500 ...
## $ CITYNAME : chr "NOT APPLICABLE" "BIRMINGHAM" "NOT APPLICABLE" "NOT APPLICABLE" ...
## $ DAY : int 1 2 2 3 4 4 7 8 9 10 ...
## $ DAYNAME : int 1 2 2 3 4 4 7 8 9 10 ...
## $ MONTH : int 1 1 1 1 1 1 1 1 1 1 ...
## $ MONTHNAME : chr "January" "January" "January" "January" ...
## $ YEAR : int 2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
## $ DAY_WEEK : int 4 5 5 6 7 7 3 4 5 6 ...
## $ DAY_WEEKNAME: chr "Wednesday" "Thursday" "Thursday" "Friday" ...
## $ HOUR : int 2 17 14 15 0 16 19 7 20 10 ...
## $ HOURNAME : chr "2:00am-2:59am" "5:00pm-5:59pm" "2:00pm-2:59pm" "3:00pm-3:59pm" ...
## $ MINUTE : int 58 18 55 20 45 55 23 15 0 2 ...
## $ MINUTENAME : chr "58" "18" "55" "20" ...
## $ NHS : int 0 0 0 0 0 0 0 0 0 1 ...
## $ NHSNAME : chr "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" ...
## $ ROUTE : int 4 6 3 4 4 3 4 4 4 2 ...
## $ ROUTENAME : chr "County Road" "Local Street - Municipality" "State Highway" "County Road" ...
## $ TWAY_ID : chr "cr-4" "martin luther king jr dr" "sr-76" "CR-ALEXANDRIA WELLINGTON RD" ...
## $ TWAY_ID2 : chr "" "" "us-280" "" ...
## $ RUR_URB : int 1 2 1 1 1 1 2 1 1 1 ...
## $ RUR_URBNAME : chr "Rural" "Urban" "Rural" "Rural" ...
## $ FUNC_SYS : int 5 4 4 7 5 4 4 5 5 3 ...
## $ FUNC_SYSNAME: chr "Major Collector" "Minor Arterial" "Minor Arterial" "Local" ...
## $ RD_OWNER : int 2 4 1 2 2 1 4 2 2 1 ...
## $ RD_OWNERNAME: chr "County Highway Agency" "City or Municipal Highway Agency" "State Highway Agency" "County Highway Agency" ...
## $ MILEPT : int 0 0 49 0 0 390 0 0 0 3019 ...
## $ MILEPTNAME : chr "None" "None" "49" "None" ...
## $ LATITUDE : num 32.4 33.5 33.3 33.8 32.8 ...
## $ LATITUDENAME: chr "32.43313333" "33.48465833" "33.29994167" "33.79507222" ...
## $ LONGITUD : num -86.1 -86.8 -86.4 -85.9 -86.1 ...
## $ LONGITUDNAME: chr "-86.09485" "-86.83954444" "-86.36964167" "-85.88348611" ...
## $ SP_JUR : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SP_JURNAME : chr "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" ...
## $ HARM_EV : int 42 12 34 42 42 12 8 12 12 12 ...
## $ HARM_EVNAME : chr "Tree (Standing Only)" "Motor Vehicle In-Transport" "Ditch" "Tree (Standing Only)" ...
## $ MAN_COLL : int 0 6 0 0 0 2 0 1 1 2 ...
## $ MAN_COLLNAME: chr "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "Angle" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" ...
## $ RELJCT1 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ RELJCT1NAME : chr "No" "No" "No" "No" ...
## $ RELJCT2 : int 1 1 3 1 1 1 3 1 8 1 ...
## $ RELJCT2NAME : chr "Non-Junction" "Non-Junction" "Intersection-Related" "Non-Junction" ...
## $ TYP_INT : int 1 1 3 1 1 1 2 1 1 1 ...
## $ TYP_INTNAME : chr "Not an Intersection" "Not an Intersection" "T-Intersection" "Not an Intersection" ...
## $ WRK_ZONE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WRK_ZONENAME: chr "None" "None" "None" "None" ...
## $ REL_ROAD : int 4 1 4 4 4 1 1 1 1 1 ...
## $ REL_ROADNAME: chr "On Roadside" "On Roadway" "On Roadside" "On Roadside" ...
## $ LGT_COND : int 2 3 1 1 2 2 3 1 2 1 ...
## $ LGT_CONDNAME: chr "Dark - Not Lighted" "Dark - Lighted" "Daylight" "Daylight" ...
## $ WEATHER : int 1 2 2 10 2 1 1 1 10 10 ...
## $ WEATHERNAME : chr "Clear" "Rain" "Rain" "Cloudy" ...
## $ SCH_BUS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SCH_BUSNAME : chr "No" "No" "No" "No" ...
## $ RAIL : chr "0000000" "0000000" "0000000" "0000000" ...
## $ RAILNAME : chr "Not Applicable" "Not Applicable" "Not Applicable" "Not Applicable" ...
## $ NOT_HOUR : int 99 17 14 99 0 17 19 7 20 10 ...
## $ NOT_HOURNAME: chr "Unknown" "5:00pm-5:59pm" "2:00pm-2:59pm" "Unknown" ...
## $ NOT_MIN : int 99 18 58 99 45 0 23 21 0 3 ...
## $ NOT_MINNAME : chr "Unknown" "18" "58" "Unknown" ...
## $ ARR_HOUR : int 3 17 15 99 0 17 19 7 20 10 ...
## $ ARR_HOURNAME: chr "3:00am-3:59am" "5:00pm-5:59pm" "3:00pm-3:59pm" "Unknown EMS Scene Arrival Hour" ...
## $ ARR_MIN : int 10 26 15 99 55 19 29 28 10 7 ...
## $ ARR_MINNAME : chr "10" "26" "15" "Unknown EMS Scene Arrival Minutes" ...
## $ HOSP_HR : int 99 99 99 99 88 18 88 88 99 10 ...
## $ HOSP_HRNAME : chr "Unknown" "Unknown" "Unknown" "Unknown" ...
## $ HOSP_MN : int 99 99 99 99 88 51 88 88 99 29 ...
## $ HOSP_MNNAME : chr "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" ...
## $ FATALS : int 3 1 1 1 1 1 1 1 1 1 ...
## $ DRUNK_DR : int 1 0 0 0 0 0 0 0 0 0 ...
Vemos que tenemos 81 variables y 35.766 registros
Revisamos la descripción de las variables contenidas en el fichero y si los tipos de variables se corresponden con las que hemos cargado. Las organizamos lógicamente para darles sentido y construimos un pequeño diccionario de datos utilizando la documentación auxiliar.
HECHOS A ESTUDIAR
DIMENSIÓN GEOGRÁFICA
DIMENSIÓN TEMPORAL
DIMENSIÓN CONDICICIONES ACCIDENTE
DIMENSIÓN METEOROLOGIA
OTROS
DIMENSIÓN SERVICIO EMERGENCIAS
DIMENSIÓN FACTORES RELACIONADOS ACCIDENTE
El siguiente paso será la limpieza de datos, mirando si hay valores vacíos o nulos.
print('NA')
## [1] "NA"
colSums(is.na(accidentData))
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 0 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS DRUNK_DR
## 0 0 0
print('Blancos')
## [1] "Blancos"
colSums(accidentData=="")
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 26997 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS DRUNK_DR
## 0 0 0
Vemos que no hay valores nulos en los datos. También verificamos si existen campos llenos de espacios en blanco. En este caso sí encontramos el campo TWAY_ID2 con 26.997 valores en blanco. Valoramos no hacer ninguna acción de eliminar registros puesto que este campo no lo utilizaremos.
Vamos a crear histogramas y describir los valores para ver los datos en general de estos atributos para hacer una primera aproximación a los datos:
if (!require('ggplot2')) install.packages('ggplot2'); library('ggplot2')
if(!require('Rmisc')) install.packages('Rmisc'); library('Rmisc')
if(!require('dplyr')) install.packages('dplyr'); library('dplyr')
if(!require('xfun')) install.packages('xfun'); library('xfun')
summary(accidentData[c("FATALS","DRUNK_DR")])
## FATALS DRUNK_DR
## Min. :1.000 Min. :0.0000
## 1st Qu.:1.000 1st Qu.:0.0000
## Median :1.000 Median :0.0000
## Mean :1.085 Mean :0.2664
## 3rd Qu.:1.000 3rd Qu.:1.0000
## Max. :8.000 Max. :4.0000
histList<- list()
n = c("FATALS","DRUNK_DR")
accidentDataAux= accidentData %>% select(all_of(n))
for(y in 1:ncol(accidentDataAux)){
col <- names(accidentDataAux)[y]
ggp <- ggplot(accidentDataAux, aes_string(x = col)) +
geom_histogram(bins = 30, fill = "cornflowerblue", color = "black",ggtittle = "Contador de ocurrencias por variable")
histList[[y]] <- ggp # añadimos cada plot a la lista vacía
}
multiplot(plotlist = histList, coles = 1)
## [1] 1
Observaciones:
Número de muertes: Todos los accidentes recogidos en estos datos reportan una muerte como mínimo. Siendo el accidente más grave con ocho víctimas y vemos que la distribución se acumula de forma muy evidente en una muerte por accidente.
Conductores bebidos involucrados en el accidente: Analizaremos con más detalle este dato más adelante para derivar un nuevo dato: Accidentes donde el alcohol está presente o no. De entrada, la media es de 0.26% de accidentes donde interviene un conductor bebido. La franja de conductores bebidos por accidente va de un conductor como mínimo a cuatro como máximo.
summary(accidentData[c("VE_TOTAL","VE_FORMS","PVH_INVL")])
## VE_TOTAL VE_FORMS PVH_INVL
## Min. : 1.00 Min. : 1.000 Min. : 0.00000
## 1st Qu.: 1.00 1st Qu.: 1.000 1st Qu.: 0.00000
## Median : 1.00 Median : 1.000 Median : 0.00000
## Mean : 1.56 Mean : 1.517 Mean : 0.04269
## 3rd Qu.: 2.00 3rd Qu.: 2.000 3rd Qu.: 0.00000
## Max. :15.00 Max. :15.000 Max. :10.00000
#Crearemos una lista para mostrar los atributos que interesan.
histList<- list()
n = c("VE_TOTAL","VE_FORMS","PVH_INVL")
accidentDataAux= accidentData %>% select(all_of(n))
for(y in 1:ncol(accidentDataAux)){
col <- names(accidentDataAux)[y]
ggp <- ggplot(accidentDataAux, aes_string(x = col)) +
geom_histogram(bins = 30, fill = "cornflowerblue", color = "black")
histList[[y]] <- ggp # añadimos cada plot a la lista vacía
}
multiplot(plotlist = histList, coles = 1)
## [1] 1
Observaciones en cuanto a los vehículos implicados.
Número de vehículos implicados (VE_TOTAL) en total está en la franja de 1 hasta 59 siendo este el valor máximo y una media de 1,5. Número de vehículos en movimiento implicados (VE_FORMS), el valor más habitual es 1 con un valor máximo también de 59. Prevemos que hay un valor extremo que habrá que tratar para poder sacar más información de esta variable. Número de vehículos estacionados implicados (PVH_INVL): Por lo que respecta a esta variable lo habitual es que no haya vehículos estacionados en los incidentes recogidos en estos datos. Con todo aparecen casos aislados donde incluso había 10 coches estacionados.
summary(accidentData[c("PEDS","PERSONS","PERMVIT","PERNOTMVIT")])
## PEDS PERSONS PERMVIT PERNOTMVIT
## Min. :0.0000 Min. : 0.000 Min. : 0.000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.:0.0000
## Median :0.0000 Median : 2.000 Median : 2.000 Median :0.0000
## Mean :0.2285 Mean : 2.173 Mean : 2.163 Mean :0.2387
## 3rd Qu.:0.0000 3rd Qu.: 3.000 3rd Qu.: 3.000 3rd Qu.:0.0000
## Max. :8.0000 Max. :61.000 Max. :61.000 Max. :9.0000
#Crearemos una lista para mostrar los atributos que interesan.
histList<- list()
n = c("PEDS","PERSONS","PERMVIT","PERNOTMVIT")
accidentDataAux= accidentData %>% select(all_of(n))
for(y in 1:ncol(accidentDataAux)){
col <- names(accidentDataAux)[y]
ggp <- ggplot(accidentDataAux, aes_string(x = col)) +
geom_histogram(bins = 30, fill = "cornflowerblue", color = "black")
histList[[y]] <- ggp # añadimos cada plot a la lista vacía
}
multiplot(plotlist = histList, coles = 1)
## [1] 1
Observaciones en cuanto a las personas implicadas en un accidente.
El número de peatones implicados (PEDS) es muy bajo siendo coherente con el tipo de vía que se estudia y dónde no es habitual que haya gente andando. Con todo el valor como media de 0,22 y máximo de 8 obliga a investigar más este dato. (PERSONS) El número de ocupantes de vehículo implicados se sitúa como media en 2,1 (PERMVIT) El número conductores y ocupantes de vehículos en circulación implicados tiene un valor de media de 2,1. Estas dos variables recogen la misma información, pero la cuantifican de diferente manera. El accidente con el mayor número de ocupantes es de 61 personas. Por lo que respecta al número peatones, ciclistas, personas en vehículos aparcados y otros (PERNOTMVIT) vemos que aumenta un poco la media respecto a peatón puesto que entendemos que se incluyen más casos.
Vamos a profundizar un poco en el tema de la relación del alcohol en los conductores y el número de accidentes.
accidentData$alcohol <- ifelse(accidentData$DRUNK_DR %in% c(0), 0, 1)
counts <- table(accidentData$alcohol)
barplot(prop.table(counts),col=c("green","red"), main="Accidentes con conductor bebido", legend.texto=c("No Alcohol","Sí Alcohol"),xlab ="Presencia Alcohol", ylab = "Porcentaje",ylim=c(0,0.8) )
## Warning in plot.window(xlim, ylim, log = log, ...): "legend.texto" is not a
## graphical parameter
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "legend.texto" is not a graphical parameter
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## "legend.texto" is not a graphical parameter
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "legend.texto"
## is not a graphical parameter
Vemos que porcentualmente, en la gran mayoría de accidentes, alrededor del 75% no hay presencia de alcohol en el conductor. Los conductores que dan positivo están alrededor de un 22%. Hemos buscado contrastar el dato con otros países y estarían en un valor central donde los valores extremos máximo por país superan el 50% y los mínimos están sobre el 10%
Observamos ahora como se distribuyen las muertes por accidente.
df1 <- accidentData %>%
group_by(accidentData$FATALS) %>%
dplyr::summarise(counts = n())
df1
## # A tibble: 8 × 2
## `accidentData$FATALS` counts
## <int> <int>
## 1 1 33226
## 2 2 2154
## 3 3 289
## 4 4 71
## 5 5 20
## 6 6 4
## 7 7 1
## 8 8 1
counts <- table(accidentData$FATALS)
barplot(prop.table(counts),col=("red"),ylim=c(0,0.99),main="Distribución de la mortalidad a los accidentes",xlab ="Número de muertos", ylab = "Porcentaje")
Vemos que la mayoría de los accidentes tienen como mínimo un muerto. Vamos ahora a relacionar mortalidad y alcohol.
counts <- table(accidentData$alcohol, accidentData$FATALS)
colors <- c("green", "red")
barplot(prop.table(counts), beside = TRUE, col = colors,
ylim = c(0, 1), axes = TRUE,
xlab = "Número de muertos",
ylab = "Porcentaje",
main = "Accidentes por muertes y conductores positivos en alcohol",
legend = c("No Alcohol", "Alcohol"),
fill = colors)
## Warning in plot.window(xlim, ylim, log = log, ...): "fill" is not a graphical
## parameter
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "fill" is not a graphical parameter
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...): "fill"
## is not a graphical parameter
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "fill" is not a
## graphical parameter
Probaremos ahora si hay relación entre el estado donde ha pasado el accidente y el número de conductores bebidos. Filtramos los cinco estados donde hay más accidentes.
accidentDataST5=subset(accidentData, accidentData$STATENAME == "California" | accidentData$STATENAME == "Texas" | accidentData$STATENAME == "Florida" | accidentData$STATENAME == "Georgia" | accidentData$STATENAME == "North Carolina")
files=dim(accidentDataST5)[1]
ggplot(data=accidentDataST5[1:files,],aes(x=DRUNK_DR,fill=STATENAME))+geom_bar()+ggtitle("Relación entre conductor bebido y Estado")+labs(x="Número de conductores bebidos implicados")
Como reflexión este gráfico tiene que pasar por el filtro de percentuar el número de accidentes por estado y la población del estado para no sacar conclusiones apresuradas.
Veamos ahora como en un mismo gráfico de frecuencias podemos trabajar con 3 variables: FATALS, STATENAME y WEATHERNAME.
ggplot(data = accidentDataST5[1:files,],aes(x=FATALS,fill=STATENAME))+geom_bar(position="fill")+facet_wrap(~WEATHERNAME)+ggtitle("Número de muertes en accidente por Estado y clima")+labs(x="Número de muertes")
Esta gráfica está bien como mecánica de construcción, pero los resultados los ponemos en entredicho. Está bien como paso inicial, pero hay que profundizar mucho más.
Vamos a buscar las correlaciones en función de las muertes y unas variables elegidas que creemos que pueden ayudar a explicar el aumento de muertes por accidente:
DRUNK_DR conductores bebidos VE_TOTAL número de vehículos implicados en total VE_FORMS número de vehículos en movimiento implicados PVH_INVL número de vehículos estacionados implicados PEDS número de peatón implicados PERSONS número de ocupante de vehículo implicados PERMVIT número conductores y ocupantes implicados PERNOTMVIT número peatones, ciclistas… Cualquier cosa menos vehículo motorizado
# Utilizamos esta librería para usar la funcio multiplot()
if(!require('Rmisc')) install.packages('Rmisc'); library('Rmisc')
n = c("DRUNK_DR","VE_TOTAL","VE_FORMS","PVH_INVL","PEDS","PERSONS","PERMVIT","PERNOTMVIT")
accidentDataAux= accidentData %>% select(all_of(n))
histList2<- vector('list', ncol(accidentDataAux))
for(i in seq_along(accidentDataAux)){
message(i)
histList2[[i]]<-local({
i<-i
col <-log(accidentDataAux[[i]])
ggp<- ggplot(data = accidentDataAux, aes(x = accidentData$FATALS, y=col)) +
geom_point(color = "gray30") + geom_smooth(method = lm,color = "firebrick") +
theme_bw() + xlab("Muertes") + ylab(names(accidentDataAux)[i])
})
}
multiplot(plotlist = histList2, cols = 3)
Podemos ver que:
De forma general cualquier aumento en las variables elegidas implica un aumento de las muertes en el accidente.
El factor que hace aumentar más el número de víctimas son las variables relacionadas con los peatones y pasajeros de los coches involucrados en el accidente.
Utilizamos las columnas que nos interesa para hacer la matriz y la visualizaremos utilizando la función corrplot.
# https://cran.r-project.org/web/packages/corrplot/vignettes/corrplot-intro.html
if(!require("corrplot")) install.packages("corrplot"); library("corrplot")
n = c("FATALS","DRUNK_DR","VE_TOTAL","VE_FORMS","PVH_INVL","PEDS","PERSONS","PERMVIT","PERNOTMVIT")
factores= accidentData %>% select(all_of(n))
res<-cor(factores)
corrplot(res,method="color",tl.col="black", tl.srt=30, order = "AOE",
number.cex=0.75,sig.level = 0.01, addCoef.col = "black")
No vemos que haya una correlación negativa significativa entre dos variables y sí una muy buena correlación ya previsible entre los peatones implicados y personas involucradas en el accidente que no van en coche. (PEDS y PERNOTMVIT) Lo mismo podemos observar en cuanto al número de conductores y ocupantes implicados (PERMVIT) y el número de vehículos implicados en movimiento (VE_FORMS) o el total de vehículos (VE_TOTAL).
Vamos a probar si hay una correlación entre personas implicadas en el accidente y el número de muertes.
if (!require('tidyverse')) install.packages('tidyverse'); library('tidyverse')
## Loading required package: tidyverse
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.3 ✔ tibble 3.2.1
## ✔ purrr 1.0.2 ✔ tidyr 1.3.0
## ✔ readr 2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::arrange() masks plyr::arrange()
## ✖ purrr::compact() masks plyr::compact()
## ✖ dplyr::count() masks plyr::count()
## ✖ dplyr::desc() masks plyr::desc()
## ✖ dplyr::failwith() masks plyr::failwith()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::id() masks plyr::id()
## ✖ dplyr::lag() masks stats::lag()
## ✖ dplyr::mutate() masks plyr::mutate()
## ✖ dplyr::rename() masks plyr::rename()
## ✖ dplyr::summarise() masks plyr::summarise()
## ✖ dplyr::summarize() masks plyr::summarize()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
cor.test(x = accidentData$PERSONS, y = accidentData$FATALS, method = "kendall")
##
## Kendall's rank correlation tau
##
## data: accidentData$PERSONS and accidentData$FATALS
## z = 53.008, p-value < 2.2e-16
## alternative hypothesis: true tau is not equal to 0
## sample estimates:
## tau
## 0.2558174
ggplot(data = accidentData, aes(x = PERSONS, y = log(FATALS))) + geom_point(color = "gray30") + geom_smooth(color = "firebrick") + theme_bw() +ggtitle("Correlación entre personas implicadas en el accidente y número de muertes")
## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
De la observación de este gráfico podemos concluir que efectivamente el número de muertes aumenta en función de las personas implicadas en un accidente pero que la correlación no es tan elevada ni continúa como se podía prever.
Si dos variables están altamente correlacionadas obviamente darán casi exactamente la misma información en un modelo de regresión, por ejemplo. Pero, al incluir las dos variables, en realidad estamos debilitando el modelo. No estamos añadiendo información incremental. En lugar de esto, estamos haciendo un modelo ruidoso. No es una buena idea.
Cómo hemos visto antes tenemos una correlación muy grande entre PEDS y PERNOTMVIT, por lo tanto, podríamos eliminar la columna de peatones (PEDS) y dejar el total de peatones y otros reflejado a PERNOTMVIT.
# accidentData$PEDS<- NULL
str(accidentData)
## 'data.frame': 35766 obs. of 82 variables:
## $ STATE : int 1 1 1 1 1 1 1 1 1 1 ...
## $ STATENAME : chr "Alabama" "Alabama" "Alabama" "Alabama" ...
## $ ST_CASE : int 10001 10002 10003 10004 10005 10006 10007 10008 10009 10010 ...
## $ VE_TOTAL : int 1 4 2 1 1 2 1 2 2 2 ...
## $ VE_FORMS : int 1 4 2 1 1 2 1 2 2 2 ...
## $ PVH_INVL : int 0 0 0 0 0 0 0 0 0 0 ...
## $ PEDS : int 0 0 0 0 0 0 1 0 0 0 ...
## $ PERSONS : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERMVIT : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERNOTMVIT : int 0 0 0 0 0 0 1 0 0 0 ...
## $ COUNTY : int 51 73 117 15 37 103 73 25 45 95 ...
## $ COUNTYNAME : chr "ELMORE (51)" "JEFFERSON (73)" "SHELBY (117)" "CALHOUN (15)" ...
## $ CITY : int 0 350 0 0 0 0 330 0 0 1500 ...
## $ CITYNAME : chr "NOT APPLICABLE" "BIRMINGHAM" "NOT APPLICABLE" "NOT APPLICABLE" ...
## $ DAY : int 1 2 2 3 4 4 7 8 9 10 ...
## $ DAYNAME : int 1 2 2 3 4 4 7 8 9 10 ...
## $ MONTH : int 1 1 1 1 1 1 1 1 1 1 ...
## $ MONTHNAME : chr "January" "January" "January" "January" ...
## $ YEAR : int 2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
## $ DAY_WEEK : int 4 5 5 6 7 7 3 4 5 6 ...
## $ DAY_WEEKNAME: chr "Wednesday" "Thursday" "Thursday" "Friday" ...
## $ HOUR : int 2 17 14 15 0 16 19 7 20 10 ...
## $ HOURNAME : chr "2:00am-2:59am" "5:00pm-5:59pm" "2:00pm-2:59pm" "3:00pm-3:59pm" ...
## $ MINUTE : int 58 18 55 20 45 55 23 15 0 2 ...
## $ MINUTENAME : chr "58" "18" "55" "20" ...
## $ NHS : int 0 0 0 0 0 0 0 0 0 1 ...
## $ NHSNAME : chr "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" ...
## $ ROUTE : int 4 6 3 4 4 3 4 4 4 2 ...
## $ ROUTENAME : chr "County Road" "Local Street - Municipality" "State Highway" "County Road" ...
## $ TWAY_ID : chr "cr-4" "martin luther king jr dr" "sr-76" "CR-ALEXANDRIA WELLINGTON RD" ...
## $ TWAY_ID2 : chr "" "" "us-280" "" ...
## $ RUR_URB : int 1 2 1 1 1 1 2 1 1 1 ...
## $ RUR_URBNAME : chr "Rural" "Urban" "Rural" "Rural" ...
## $ FUNC_SYS : int 5 4 4 7 5 4 4 5 5 3 ...
## $ FUNC_SYSNAME: chr "Major Collector" "Minor Arterial" "Minor Arterial" "Local" ...
## $ RD_OWNER : int 2 4 1 2 2 1 4 2 2 1 ...
## $ RD_OWNERNAME: chr "County Highway Agency" "City or Municipal Highway Agency" "State Highway Agency" "County Highway Agency" ...
## $ MILEPT : int 0 0 49 0 0 390 0 0 0 3019 ...
## $ MILEPTNAME : chr "None" "None" "49" "None" ...
## $ LATITUDE : num 32.4 33.5 33.3 33.8 32.8 ...
## $ LATITUDENAME: chr "32.43313333" "33.48465833" "33.29994167" "33.79507222" ...
## $ LONGITUD : num -86.1 -86.8 -86.4 -85.9 -86.1 ...
## $ LONGITUDNAME: chr "-86.09485" "-86.83954444" "-86.36964167" "-85.88348611" ...
## $ SP_JUR : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SP_JURNAME : chr "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" ...
## $ HARM_EV : int 42 12 34 42 42 12 8 12 12 12 ...
## $ HARM_EVNAME : chr "Tree (Standing Only)" "Motor Vehicle In-Transport" "Ditch" "Tree (Standing Only)" ...
## $ MAN_COLL : int 0 6 0 0 0 2 0 1 1 2 ...
## $ MAN_COLLNAME: chr "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "Angle" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" ...
## $ RELJCT1 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ RELJCT1NAME : chr "No" "No" "No" "No" ...
## $ RELJCT2 : int 1 1 3 1 1 1 3 1 8 1 ...
## $ RELJCT2NAME : chr "Non-Junction" "Non-Junction" "Intersection-Related" "Non-Junction" ...
## $ TYP_INT : int 1 1 3 1 1 1 2 1 1 1 ...
## $ TYP_INTNAME : chr "Not an Intersection" "Not an Intersection" "T-Intersection" "Not an Intersection" ...
## $ WRK_ZONE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WRK_ZONENAME: chr "None" "None" "None" "None" ...
## $ REL_ROAD : int 4 1 4 4 4 1 1 1 1 1 ...
## $ REL_ROADNAME: chr "On Roadside" "On Roadway" "On Roadside" "On Roadside" ...
## $ LGT_COND : int 2 3 1 1 2 2 3 1 2 1 ...
## $ LGT_CONDNAME: chr "Dark - Not Lighted" "Dark - Lighted" "Daylight" "Daylight" ...
## $ WEATHER : int 1 2 2 10 2 1 1 1 10 10 ...
## $ WEATHERNAME : chr "Clear" "Rain" "Rain" "Cloudy" ...
## $ SCH_BUS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SCH_BUSNAME : chr "No" "No" "No" "No" ...
## $ RAIL : chr "0000000" "0000000" "0000000" "0000000" ...
## $ RAILNAME : chr "Not Applicable" "Not Applicable" "Not Applicable" "Not Applicable" ...
## $ NOT_HOUR : int 99 17 14 99 0 17 19 7 20 10 ...
## $ NOT_HOURNAME: chr "Unknown" "5:00pm-5:59pm" "2:00pm-2:59pm" "Unknown" ...
## $ NOT_MIN : int 99 18 58 99 45 0 23 21 0 3 ...
## $ NOT_MINNAME : chr "Unknown" "18" "58" "Unknown" ...
## $ ARR_HOUR : int 3 17 15 99 0 17 19 7 20 10 ...
## $ ARR_HOURNAME: chr "3:00am-3:59am" "5:00pm-5:59pm" "3:00pm-3:59pm" "Unknown EMS Scene Arrival Hour" ...
## $ ARR_MIN : int 10 26 15 99 55 19 29 28 10 7 ...
## $ ARR_MINNAME : chr "10" "26" "15" "Unknown EMS Scene Arrival Minutes" ...
## $ HOSP_HR : int 99 99 99 99 88 18 88 88 99 10 ...
## $ HOSP_HRNAME : chr "Unknown" "Unknown" "Unknown" "Unknown" ...
## $ HOSP_MN : int 99 99 99 99 88 51 88 88 99 29 ...
## $ HOSP_MNNAME : chr "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" ...
## $ FATALS : int 3 1 1 1 1 1 1 1 1 1 ...
## $ DRUNK_DR : int 1 0 0 0 0 0 0 0 0 0 ...
## $ alcohol : num 1 0 0 0 0 0 0 0 0 0 ...
Seguidamente vayamos a asignar un 1 por accidentes que se producen de madrugada (01h a 06h en invierno) y un 0 para el resto de franja horaria, es decir, vamos a categorizar la variable HOUR y así tendremos una variable numérica que nos permitirá trabajar mejor en el futuro. La denominaremos madrugada. Después la utilizaremos para ver cómo se distribuyen los accidentes en las dos franjas horarias. Debemos tener en cuenta que la hora incluye el código 99 qué quiere decir que la hora no está informada. Miraremos de filtrar los registros con este valor para excluirlos.
accidentDataAux=subset(accidentData, accidentData$HOUR <= 24)
accidentData$madrugada <- NA
accidentData$madrugada[accidentDataAux$HOUR >=1 & accidentDataAux$HOUR <= 6] <- 1
accidentData$madrugada[accidentDataAux$HOUR ==0 | accidentDataAux$HOUR >6 ] <- 0
counts <- table(accidentData$madrugada)
barplot(prop.table(counts),col=c("green","red"),legend.texto=c("Resto del día","Madrugada"),ylim=c(0,1), main="Distribución de accidentes la madrugada y resto del día",xlab="0 Resto del día 1 Madrugada",ylab="Porcentaje" )
## Warning in plot.window(xlim, ylim, log = log, ...): "legend.texto" is not a
## graphical parameter
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "legend.texto" is not a graphical parameter
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## "legend.texto" is not a graphical parameter
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "legend.texto"
## is not a graphical parameter
Ahora añadiremos un campo nuevo a los datos. Este campo contendrá el valor de la hora del accidente discretizada con un método simple de intervalos de igual amplitud.
summary(accidentDataAux[,"HOUR"])
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 7.00 15.00 13.19 19.00 23.00
Discretizamos con intervalos. Los criterios de corte están cogidos de la Web del Parlamento de Cataluña.
accidentDataAux["segmento_horario"] <- cut(accidentDataAux$HOUR, breaks = c(0,4,11,14,18,22), labels = c("Madrugada", "Mañana", "Mediodía", "Anochecer","Noche"))
Observamos los datos discretizados y construimos un gráfico para analizar cómo se agrupan los accidentes.
head(accidentDataAux$segmento_horario)
## [1] Madrugada Anochecer Mediodía Anochecer <NA> Anochecer
## Levels: Madrugada Mañana Mediodía Anochecer Noche
plot(accidentDataAux$segmento_horario,main="Número de accidentes por segmento horario",xlab="Segmento horario", ylab="Cantidad",col = "ivory")
Ahora vamos a discretizar la variable que contiene el número de vehículos implicados en un accidente (VE_TOTALS) puesto que era una de las variables en que las distancias entre sus valores eran muy grandes:
# Utilizaremos la función discretize de arules: This function implements several basic unsupervised methods to convert a continuous variable into a categorical variable (factor) using different binning strategies.
# https://cran.r-project.org/web/packages/arules/index.html
if (!require('arules')) install.packages('arules'); library('arules')
## Loading required package: arules
## Loading required package: Matrix
##
## Attaching package: 'Matrix'
## The following objects are masked from 'package:tidyr':
##
## expand, pack, unpack
##
## Attaching package: 'arules'
## The following object is masked from 'package:dplyr':
##
## recode
## The following objects are masked from 'package:base':
##
## abbreviate, write
set.seed(2)
table(discretize(accidentData$VE_TOTAL, "cluster" ))
##
## [1,1.57) [1.57,3.38) [3.38,15]
## 19972 14972 822
hist(accidentData$VE_TOTAL, main="Número de accidentes por vehículos implicados con kmeans",xlab="Vehículos implicados", ylab="Cantidad",col = "ivory")
abline(v=discretize(accidentData$VE_TOTAL, method="cluster", onlycuts=TRUE),col="red")
Podemos observar que sin pasar ningún argumento y permitiendo que el algoritmo elija el conjunto de particiones se muestran tres clústeres que agrupan los vehículos implicados en las franjas mencionadas. Podemos asignar el propio clúster como una variable más al dataset para trabajar después.
accidentData$VE_TOTAL_KM<- (discretize(accidentData$VE_TOTAL, "cluster" ))
head(accidentData$VE_TOTAL_KM)
## [1] [1,1.5) [2.73,15] [1.5,2.73) [1,1.5) [1,1.5) [1.5,2.73)
## Levels: [1,1.5) [1.5,2.73) [2.73,15]
Ahora normalizaremos el número de muertes por el máximo añadiendo un nuevo campo a los datos que contendrá el valor.
accidentData$FATALS_NM<- (accidentData$FATALS/max(accidentData[,"FATALS"]))
head(accidentData$FATALS_NM)
## [1] 0.375 0.125 0.125 0.125 0.125 0.125
Supongamos que queremos normalizar por la diferencia para ubicar entre 0 y 1 la variable del número de muertes del accidente dado que el algoritmo de minería que utilizaremos así lo requiere. Observamos la distribución de la variable original y las generadas.
accidentData$FATALS_ND = (accidentData$FATALS-min(accidentData$FATALS))/(max(accidentData$FATALS)-min(accidentData$FATALS))
max(accidentData$FATALS)
## [1] 8
min(accidentData$FATALS)
## [1] 1
hist(accidentData$FATALS,xlab="Muertos", col="ivory",ylab="Cantidad", main="Número de muertes en accidente")
hist(accidentData$FATALS_NM,xlab="Muertos",ylab="Cantidad",col="ivory", main="Muertos normalizado por el máximo")
hist(accidentData$FATALS_ND,xlab="Muertos",ylab="Cantidad", col="ivory", main="Muertos normalizado por la diferencia")
A continuación, vamos a normalizar las otras columnas para asegurarnos que cada variable contribuye por igual en nuestro análisis.
# Definimos la función de normalización
nor <-function(x) { (x -min(x))/(max(x)-min(x))}
# Guardamos un nuevo dataset normalizado
accidentData$type<- NULL
n = c("FATALS","DRUNK_DR","VE_TOTAL","VE_FORMS","PVH_INVL","PEDS","PERSONS","PERMVIT","PERNOTMVIT")
accidentData<- accidentData %>% select(all_of(n))
accidentData_nor <- as.data.frame(lapply(accidentData, nor))
head(accidentData_nor)
## FATALS DRUNK_DR VE_TOTAL VE_FORMS PVH_INVL PEDS PERSONS PERMVIT
## 1 0.2857143 0.25 0.00000000 0.00000000 0 0 0.06557377 0.06557377
## 2 0.0000000 0.00 0.21428571 0.21428571 0 0 0.09836066 0.09836066
## 3 0.0000000 0.00 0.07142857 0.07142857 0 0 0.03278689 0.03278689
## 4 0.0000000 0.00 0.00000000 0.00000000 0 0 0.08196721 0.08196721
## 5 0.0000000 0.00 0.00000000 0.00000000 0 0 0.01639344 0.01639344
## 6 0.0000000 0.00 0.07142857 0.07142857 0 0 0.04918033 0.04918033
## PERNOTMVIT
## 1 0
## 2 0
## 3 0
## 4 0
## 5 0
## 6 0
Tanto el análisis de componentes principales, principal componente analysis (PCA) en inglés, como la descomposición de valores singulares, singular value decomposition (SVD) en inglés, son técnicas que nos permitan trabajar con nuevas características llamadas componentes, que ciertamente son independientes entre sí. En realidad, estas dos técnicas nos permiten representar el juego de datos en un nuevo sistema de coordenadas que denominamos componentes principales. Este sistema está mejor adaptado a la distribución del juego de datos, de forma que recoge mejor su variabilidad.
Aplicamos el análisis de componentes principales al dataset. Empezamos ejecutando la función prcomp().
pca.acc <- prcomp(accidentData_nor)
summary(pca.acc)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 0.1168 0.08755 0.0690 0.0484 0.03269 0.02437 0.01072
## Proportion of Variance 0.4520 0.25389 0.1577 0.0776 0.03539 0.01967 0.00381
## Cumulative Proportion 0.4520 0.70584 0.8635 0.9411 0.97652 0.99619 1.00000
## PC8 PC9
## Standard deviation 5.213e-15 2.159e-15
## Proportion of Variance 0.000e+00 0.000e+00
## Cumulative Proportion 1.000e+00 1.000e+00
Como se puede observar la función summary, nos devuelve la proporción de varianza aplicada al conjunto total de cada atributo. Gracias a esto, el atributo 1 explica el 0.452 de variabilidad del total de datos; en cambio, el atributo 7 explica solo el 0.000381.
A continuación, se muestra un histograma para ver el peso de cada atributo sobre el conjunto total de datos:
if (!require('factoextra')) install.packages('factoextra'); library('factoextra')
## Loading required package: factoextra
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
#Los valores propios corresponden a la cantidad de variación explicada por cada componente principal (PC).
ev= get_eig(pca.acc)
ev
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 1.364366e-02 4.519469e+01 45.19469
## Dim.2 7.664656e-03 2.538921e+01 70.58391
## Dim.3 4.760727e-03 1.576993e+01 86.35384
## Dim.4 2.342530e-03 7.759642e+00 94.11348
## Dim.5 1.068327e-03 3.538839e+00 97.65232
## Dim.6 5.937915e-04 1.966938e+00 99.61926
## Dim.7 1.149407e-04 3.807416e-01 100.00000
## Dim.8 2.717197e-29 9.000729e-26 100.00000
## Dim.9 4.659472e-30 1.543453e-26 100.00000
fviz_eig(pca.acc)
En este ejercicio se decidió utilizar el método de Káiser para decidir cuales de las variables obtenidas serán escogidas. Este criterio mantendrá todas aquellas variables cuya varianza sea superior a 1.
# Calculamos la varianza de los componentes principales a partir de la desviación estándar
var_acc <- pca.acc$sdev^2
var_acc
## [1] 1.364366e-02 7.664656e-03 4.760727e-03 2.342530e-03 1.068327e-03
## [6] 5.937915e-04 1.149407e-04 2.717197e-29 4.659472e-30
Con los resultados obtenidos es muy complicado decidir cuáles son los componentes principales componentes a escoger. Este hecho podría estar causado por no haber escalado los datos previamente. Por lo tanto, el siguiente paso es escalar los datos y volver a calcular la varianza para ver qué datos selecciona.
# Escalamos los datos
acc_scale <- scale(accidentData_nor)
# Calculamos las componentes principales
pca.acc_scale <- prcomp(acc_scale)
# Mostramos la varianza de dichas variables:
var_acc_scale <- pca.acc_scale$sdev^2
head(var_acc_scale)
## [1] 3.5632826 1.8581532 1.1186798 1.0185157 0.8423082 0.5603141
Después de analizar la varianza y aplicando el criterio de Káiser nos quedaremos con los componentes principales 1,2,3 y 4 que son los superiores a 1. Este criterio tiene el problema de sobreestimar el número de factores, pero a pesar de ello es el que aplicaremos para analizar los resultados.
Mostramos el histograma de porcentaje de varianza explicado con los datos escalados:
fviz_eig(pca.acc_scale)
ev = get_eig(pca.acc_scale)
ev
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 3.563283e+00 3.959203e+01 39.59203
## Dim.2 1.858153e+00 2.064615e+01 60.23817
## Dim.3 1.118680e+00 1.242978e+01 72.66795
## Dim.4 1.018516e+00 1.131684e+01 83.98479
## Dim.5 8.423082e-01 9.358980e+00 93.34377
## Dim.6 5.603141e-01 6.225712e+00 99.56948
## Dim.7 3.874645e-02 4.305161e-01 100.00000
## Dim.8 4.353003e-26 4.836670e-25 100.00000
## Dim.9 2.164538e-26 2.405042e-25 100.00000
Los valores propios se pueden utilizar para determinar el número de componentes principales a retener después de la PCA (Kaiser 1961):
Un valor propio > 1 indica que los PCs representan más varianza de la que representa una de las variables originales de los datos estandarizados. Esto se utiliza habitualmente como punto de corte para el cual se conservan los PCs. Esto solo es cierto cuando los datos están estandarizados.
También podemos limitar el número de componentes a este número que representa una determinada fracción de la varianza total. Por ejemplo, si estamos satisfecho con el 80% de la varianza total explicada, usamos el número de componentes para conseguirlo que son los 4 componentes principales vistos antes.
Continuamos con el análisis de los componentes principales. Después de aplicar el método Káiser se han seleccionado los 4 componentes principales.
var <- get_pca_var(pca.acc_scale)
var
## Principal Component Analysis Results for variables
## ===================================================
## Name Description
## 1 "$coord" "Coordinates for the variables"
## 2 "$cor" "Correlations between variables and dimensions"
## 3 "$cos2" "Cos2 for the variables"
## 4 "$contrib" "contributions of the variables"
Los componentes de get_pca_var() se pueden utilizar en el diagrama de variables de la siguiente manera:
#Utilizamos los 4 componentes principales encontrados antes
head(var$coord[,1:4],11)
## Dim.1 Dim.2 Dim.3 Dim.4
## FATALS -0.30725642 0.07606945 0.28817514 -0.73967833
## DRUNK_DR -0.04921565 -0.38170799 -0.26454706 -0.58497489
## VE_TOTAL -0.83708697 0.28706095 -0.34390477 0.13727724
## VE_FORMS -0.86483356 0.18416941 -0.02398033 0.21866655
## PVH_INVL -0.06062570 0.30358100 -0.85844575 -0.18336810
## PEDS 0.48249027 0.82661079 0.13673775 -0.08353380
## PERSONS -0.88514448 0.21755791 0.19732665 -0.07582156
## PERMVIT -0.88736748 0.19749105 0.22352113 -0.06716534
## PERNOTMVIT 0.45872440 0.85355861 0.04773257 -0.10804664
La calidad de representación de las variables en el mapa de factores se denomina cos2 (coseno cuadrado, coordenadas cuadradas). Podemos acceder al cos2 de la siguiente manera:
head(var$cos2[,1:4],11)
## Dim.1 Dim.2 Dim.3 Dim.4
## FATALS 0.094406509 0.005786562 0.083044911 0.547124037
## DRUNK_DR 0.002422180 0.145700988 0.069985146 0.342195618
## VE_TOTAL 0.700714591 0.082403990 0.118270488 0.018845040
## VE_FORMS 0.747937080 0.033918370 0.000575056 0.047815060
## PVH_INVL 0.003675475 0.092161422 0.736929104 0.033623861
## PEDS 0.232796860 0.683285394 0.018697211 0.006977896
## PERSONS 0.783480750 0.047331446 0.038937806 0.005748910
## PERMVIT 0.787421038 0.039002717 0.049961697 0.004511183
## PERNOTMVIT 0.210428078 0.728562294 0.002278398 0.011674076
corrplot(var$cos2[,1:4], is.corre=FALSE)
## Warning in text.default(pos.xlabel[, 1], pos.xlabel[, 2], newcolnames, srt =
## tl.srt, : "is.corre" is not a graphical parameter
## Warning in text.default(pos.ylabel[, 1], pos.ylabel[, 2], newrownames, col =
## tl.col, : "is.corre" is not a graphical parameter
## Warning in title(title, ...): "is.corre" is not a graphical parameter
También es posible crear un diagrama de barras de variables cos2 mediante la función fviz_cos2():
fviz_cos2(pca.acc_scale, choice = "var", axes = 1:2)
Un cos2 elevado indica una buena representación de la variable en el componente principal. En este caso, la variable se coloca cerca de la circunferencia del círculo de correlación.
Un cos2 bajo indica que la variable no está perfectamente representada por los PC. En este caso, la variable está cerca del centro del círculo.
Para una variable dada, la suma del cos2 de todos los componentes principales es igual a uno.
Si una variable está perfectamente representada por solo dos componentes principales (Dim.1 y Dim.2), la suma del cos2 en estos dos PCs es igual a uno. En este caso las variables se colocarán en el círculo de correlaciones.
Para algunas de las variables, pueden ser necesarios más de 2 componentes para representar perfectamente los datos. En este caso las variables se sitúan dentro del círculo de correlaciones.
En resumen:
fviz_pca_var(pca.acc_scale,
col.var = "cos2",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE
)
Las contribuciones de las variables en la contabilización de la variabilidad de un determinado componente principal se expresan en porcentaje.
Las variables que están correlacionadas con PC1 (es decir, Dim.1) y PC2 (es decir, Dim.2) son las más importantes para explicar la variabilidad en el conjunto de datos.
Las variables que no están correlacionadas con ningún PC o con las últimas dimensiones son variables con una contribución baja y se pueden eliminar para simplificar el análisis global.
La contribución de las variables se puede extraer de la siguiente manera:
head(var$contrib[,1:4],11)
## Dim.1 Dim.2 Dim.3 Dim.4
## FATALS 2.64942527 0.3114147 7.42347448 53.7177824
## DRUNK_DR 0.06797608 7.8411720 6.25604798 33.5974816
## VE_TOTAL 19.66486180 4.4347254 10.57232696 1.8502454
## VE_FORMS 20.99011424 1.8253807 0.05140488 4.6945826
## PVH_INVL 0.10314857 4.9598398 65.87489045 3.3012610
## PEDS 6.53321358 36.7722855 1.67136397 0.6851044
## PERSONS 21.98761218 2.5472306 3.48069265 0.5644400
## PERMVIT 22.09819245 2.0990044 4.46613018 0.4429174
## PERNOTMVIT 5.90545583 39.2089469 0.20366845 1.1461852
Cuando más grande sea el valor de la contribución, más contribución habrá al componente.
corrplot(var$contrib[,1:4], is.cor=FALSE)
Las variables más importantes (que más contribuyen) se pueden resaltar a la gráfica de correlación de la siguiente manera:
fviz_pca_var(pca.acc_scale, col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07")
)
Las variables correlacionadas positivas apuntan al mismo lado de la trama. Las variables correlacionadas negativas apuntan a lados opuestos del gráfico. Por ejemplo, vemos que las personas involucradas en un accidente (PVH_INVL) y conductor bebido (DRUNK_DR) apuntan direcciones opuestas por tanto no están nada correlacionas, además lo hemos visto antes puesto que tienen un coeficiente de correlación de -0.01.
Se observa que las variables que más aportan a las componentes principales son PEDS y PERNOTMVIT por un lado y VE_TOTAL, VE_FORMS, PERSONS y PERMVIT por otro. Esto es debido al hecho que están correlacionadas. En concreto por el diagrama de correlación de antes de que PEDS está muy bien correlacionada con PERNOTMVIT. De otra banda VE_TOTAL, VE_FORMS, PERSONS y PERMVIT están también bastante correlacionadas. La correlación de FATALS con este grupo de variables no es elevada, pero apunta en la misma dirección.
Podrían ahora rehacer los componentes excluyendo las variables que no aportan información. Una vez rehechas estas nuevas variables sustituyen a las originales que las forman y se podrían utilizar por ejemplo como un indicador de gravedad de accidente puesto que incluye vehículo en movimiento, parado, peatones, conductores y otros implicados en una sola variable.
Los datos estudiados contemplan accidentes de tráfico con víctimas en las redes de autopistas en los EUUU a largo del 2020. Todos los registros tienen un identificador único de accidente y una serie de hechos principales como número de muertos, número de conductores bebidos, vehículos y personas implicadas. Tenemos que añadir otras variables que los caracterizan agrupadas por ubicación geográfica, temporal, condiciones específicas del accidente, meteorológicas, la intervención del servicio de emergencias y otros factores.
Revisados los datos parecen bien informados. Los datos están bastante limpios y bien documentados. No plantean graves problemas de campos con valores nulos o vacíos y tienen bastante potencial para generar nuevos indicadores a partir de los datos.
Podemos afirmar que a lo largo del 2020 en las autopistas de EE. UU. sucedieron 35.766 accidentes en los que perdieron la vida 38.824 personas. Pretendiamos extraer relaciones entre la presencia de alcohol en los conductores y el número de accidentes, pero las conclusiones no fueron claras. Las relaciones más obvias comprobadas son el incremento de muertes en función del incremento del número de vehículos, pasajeros y peatones implicados.
Habría que profundizar mucho más. Sí que podemos perfilar cómo son los accidentes típicos en cuanto al número de vehículos y personas, conductores o peatones implicados.
El más habitual es un muerto por accidente incrementándose este valor en función de las variables relacionadas. Los conductores bebidos aparecen en uno de cada cuatro accidentes mortales aproximadamente. Los vehículos implicados en los accidentes son típicamente uno pudiéndose incrementar a dos en los casos más típicos. El número de peatones implicados es relativamente bajo dado el tipo de vía que estamos estudiando.
En cuanto al consumo de alcohol, con el grado de profundidad estudiado, no se observa un estado donde las proporcionalidades del número de conductor con presencia de alcohol sean superiores a otros estados.
Estudiando el número de muertes en accidente en relación con el estado donde ha sucedido y la condición climática, vemos necesario profundizar con técnicas por ejemplo de agregación para ver cómo se agrupan y poder obtener un perfil.
Se ha estudiado la franja horaria de la madrugada para ver si acumula un mayor número de accidentes, no siendo así. Parece que el número de accidentes mantiene también proporcionalidad respecto las franjas horarias. Se ha estudiado el número de accidentes por segmento horario con una discretización fijada en intervalo arbitrarios. La mayor presencia de accidentes en horario por la mañana y anochecer (ir y volver al trabajo) hace pensar en que queda pendiente estudiar dado el tipo de vía la distribución horaria de los accidentes lunes a viernes respecto a los fines de semana y festivos para ver si hay horas donde se acumulan más accidentes mortales.
Finalmente, con la técnica de los componentes principales hemos generado una nueva variable que combina otras variables con una correlación inicial que se podría considerar como índice de gravedad del accidente.
Propón un proyecto completo de minería de datos. La organización de la respuesta tiene que coincidir en las fases típicas del ciclo de vida de un proyecto de minería de datos. No hay que realizar las tareas de la fase. Para cada fase indica cuál es el objetivo de la fase y el producto que se obtendrá. Utiliza ejemplos de qué y cómo podrían ser las tareas. Si hay alguna característica que hace diferente el ciclo de vida de un proyecto de minería respecto a otros proyectos indícalo.
Escribe aquí la respuesta a la pregunta
Como en cualquier proyecto de Minería de Datos, o de búsqueda de conocimiento en bases de datos, primero hay que tener claro cual es el objetivo principal, en definitiva, cual es el conocimiento que queremos extraer. Como es obvio, al tratarse de un proceso práctico, encontraremos dificultades e incluso evidencias que prueben lo contrario de aquello que queremos demostrar.
Hay que tener en cuenta que la definción del objetivo(s) es un paso muy importante, ya que tal y como se ha leído en “Proceso de Minería de Datos”; “Los objetivos del proyecto de minería de datos determinan el tipo de modelo de conocimiento que tenemos que extraer”
Para este proyecto de minería de datos, antes de definir el objetivo definitivo, he hecho una pequeña lluvia de ideas que he creído conveniente dejar en la respuesta a este primer ejercicio:
En que estados de EEUU hay más accidentes donde estén implicados autobuses escolares.
¿Cuantas personas de media suele haber implicadas en el coche accidentado en cada estado? Esto nos daría información acerca de la cantidad media de gente que viaja en un coche en cada estado de EEUU, y podría ayudarnos en otros proyectos de mineria de datos.
La gente que toma drogas, ¿suele ir acompañada cuando tienen un accidente, o van solas? Podríamos hacer una comparativa entre estados y calcular la media de gente que hay en un coche accidentado, esto mismo podríamos hacerlo con el alcohol.
¿Hay más accidentes por drogas en zonas rurales o en zonas urbanas? ¿y por alcohol?
Se podría hacer un estudio acerca de como el tiempo meteorológico afecta en accidentes causados por drogas o alcohol, es decir; ¿cuando llueve o nieva es más probable que la gente beba o se intoxique con drogas? o ¿es el buen tiempo el que propicia este tipo de accidentes?
Podríamos también demostrar en que hora del día hay más accidentes con autobuses escolares implicados.
¿Que tipo de coches suele verse envuelto en un accidente, en que tipo de carreteras? y ¿en que franja temporal suelen darse esos accidentes (noche/dia)? ¿que tiempo hacia? ¿condiciones lumínicas? Luego hacer una comparativa entre estados.
Buscar una correlación entre el tiempo que suele llegar al hospital la victima y el tipo de vía en el que se ha dado el accidente, y si era un entorno rural o urbano.
Observando la base de datos me doy cuenta de que en la mayoria de los casos cuando la persona iba bajo los efectos del alcohol, o no se sabía lo que tardaba en llegar al hospital o directamente no iba al hostpital, además de que tal y como se ha descrito antes, siemore hay un muerto en todos los accidentes del archivo csv.
Buscar una correlación entre las variables de si iba borracho o no y la catidad de gente implicada en el accidente. Hacer una comparativa entre estados, tipo de carretera y entorno (rural o urbano)
¿En que tipo de cruces o intersecciones se producen más accidentes? ¿La gente suele ir bebida en esos cruces o intersecciones?
¿Suele haber más peatones implicados o menos en un tipo de cruce o otro? Esto nos daría información acerca de cuanto de peligrosos son esos escenarios.
¿En que entornos hay más accidentes por intoxicación de alcohol (rurales/urbanos)?
OBJETIVO GENERAL: Tras haberle echado un vistazo a la base de datos “accidentes.csv” he visto que se especificaban datos como el entorno en el que se había dado el accidente (urbano/rural), si hay intersección y el tipo, el condado en el que había sucedido, la ciudad, así como el estado en el que se ha dado el incidente y las condiciones atmosféricas. Por lo tanto, el objetivo que propongo, persiguiría conocer los estados, el entorno y los tipos de interseciones que más accidentes acumulan, para en un futuro predecir posibles lugares geográficos donde más accidentes podrían ocurrir, y consecuentemente, prevenir estos accidentes.
Se trataría de un modelo predictivo, que como sabemos por teoría, este tipo de modelos guardan muchas similitudes con los modelos de clasificación, no obstante, este caso contempla más de dos clases (por ejemplo; hay más de dos estados en EEUU, más de dos ciudades en cada estado, etc. El entorno es la única clase binaria (rural o ubano) por lo tanto la tarea de clasificación puede comprenderse como un proceso de predicción que tiene que asignarle un valor a la etiqueta. Como hemos visto en teoría, varios ejemplos de modelos predictivos serían los arboles de decisión y un ejemplo más contemporáneo serían las series temporales construidas por redes neuronales.
Quitar este siguiente párrafo que a partir de las variables que haya en la base de datos, el modelo remarque aquellas que incrementen la gravedad del accidente, mostrando además el grado de relación entre las distintas variables, para saber además que situación se tiene que dar para que exista tal relación entre un conjunto de variables. Esto sería posible analizando los accidentes y sacando un común denominador entre ellos, viendo que variables comparten, y aquellas variables que compartan serán las variables que aumenten el factor de riesgo en los accidentes.
Después de haber definido el objetivo del proyecto de minería de datos, se enuncia a continuación las fases del proyecto que se deberian que acometer:
FASES DEL PROYECTO:
- Definción del objetivo/tarea del proyecto:: En esta fase se formula la pregunta cuya respuesta queremos obtener por medio del proyecto de minería de datos. La elección del modelo también forma parte de este apartado.
- Selección de datos: Como es de esperar y por lo que se ha inferido de la teoría, se nos proveerá con una base de datos, de la cual tendremos que extraer aquello que nos interese para nuestro proyecto de minería de datos. No obstante, previamente hay que “pulir” y enriquecer todos los datos, afin de asegurar buenos resultados. Como se ha visto en teoría y como dijo Pablo Picasso; “El arte es la eliminación de lo innecesario”
- Comienzo del proceso de minería: Esta parte es la que seguramente más tiempo nos lleve junto con la anterior, pues comprende muchos escalones y obstáculos que hay que superar, desde mi punto de vista, creo que es la parte más sucia pero a la vez más enriquecedora, ya que hay que mancharse las manos, ya sea graficando, calculando correlaciones, aproximando resultados, eligiendo el tipo de gráficas, cambiando de escala los datos, etc. No obstante, si ese trabajo es llevado a cabo correctamente, y si se explotan muchas de las infinitas posibilidades, lo más probable es que se acabe extrayendo conocimiento y se descubran relaciones y detonantes nunca vistos, de un conjunto de datos que incialmente podían resultar poco prometedores
- Evaluación, interpretación e integración: Primero tendremos que comprobar que el modelo lleva a cabo la tarea que le hemos asignado, luego tendremos que interpretar los resultados que arroje, ya que puede que el modelo haga “algo” pero es posible que los datos obtenidos no sean los esperados, y por ello hay que asegurarse que aquello que devuelve el modelo es lógico. Por último, si todo lo anterior se ha relalizado correctamente, y el modelo se comporta como esperamos, es momento de integrarlo donde corresponda, ya sea en el servidor de una empresa o de una institución académica o gubernamental.
Se han explicado las fases muy brevemente y acorde con aquello que se ha interpretado de la teoría. Tras haber indicado el objetivo del proyecto, ahora se pasa a la segunda fase; Origen de los datos
Origen de los datos
En este caso, no hay que buscar datos, porque ya se tiene la base de datos que se va a explorar en el proyecto; accident.csv El primer paso ahora consiste en cargar el fichero de datos
# Cargamos el fichero de datos
#nombre_archivo = 'accident.CSV' #Especifico el nombre del fichero que quiero leer o su ruta completa si este no estuviese en la misma carpeta que el script desde el que lo estoy llamando
#Ahora se lee el fichero en formato csv
#datos <- read.csv(nombre_archivo)
Después de cargar los datos, hay que preparar los datos, para ello, primero se procede a comprobar su estructura, afin de:
Saber como están dispuestos los datos.
Como en este caso es una tabla, saber cuantas filas y cuantas columnas hay, y conocer hasta cierto rango, los valores de cada una de las filas o columnas.
El número de variables y sus identificadores
Para ello se realiza esta pequeña exploración;
#structure = str(datos)
Lo que se obtendría al simular esta linea de código sería una visualización parcial de los datos. En el caso de tener un documento explicativo que explicase en detalle el significado de cada una de las filas o columnas, habría que revisarlo, para saber que información brindan cada una de ellas y saber si se pueden ir descartando filas y/o columnas de datos que no sean interesantes para el objetivo del proyecto Luego de haber llevado a cabo una breve previsualización, hay que estudiar la posibilidad de generar nuevas variables derivadas de algunas ya existentes, pero eso se verá en la siguiente fase; limpieza de datos.
En el apartado de la limpieza de datos se pretende procesar los datos con el fin de eliminar información redundante, errores tipográficos o incluso añadir datos nuevos. Para ello, primeramente se comprueba la existencia de valores nulos o posiciones vacias en la tabla de datos.
#print('NA')
#colSums(is.na(accidentData))
#print('Blancos')
#colSums(accidentData=="")
Esto devolverá el número de columnas (variables) que tengan valores NULOS o VACÍOS. En el caso de encontrarse con valores vacios, una práctica común sería calcular la media o la mediana de los valores que ese atributo toma a lo largo del resto de accidentes, y asignárselo a ese campo en concreto, hay que tener en cuenta, que tal y como se estudió en teoría, esto podría afectar al modelo negativamente, introduciendo ruido o confundiéndole, no obstante, es mejor eso que dejar celdas vacías. Si hubiese una columna entera con valores nulos o vacios, entonces se eliminaría ya que no habría ninguna referencia y por lo tanto no aportaría ninguna información al modelo, al revés, impactaría negativamente en él. Se ha podido comprobar en la base de datos de accident.csv como había varias celdas en
El siguiente paso consistiría en comprobar que no haya tuplas repetidas, es decir, filas que aparezcan en la tabla de datos más de una vez:
# Detectar filas duplicadas
#filas_duplicadas <- datos[duplicated(datos) | duplicated(datos, fromLast = TRUE), ] #fila dupliacada o NO, asi con todas
#Ahora se visualizan las filas duplicadas
#Por último se eliminan:
#unique_df <- unique(df)
La siguiente tarea sería comprobar que no hubiese ningún campo (celda dentro de cualquier columna) que contenga números o caracteres erróneos, es decir, comprobar que no haya ningún dato inconsistente. Si por ejemplo una variable solo puede tomar un conjunto de valores determinado, comprobar que para todos los accidentes, i.e., para la columna correspondiente a esa variable en todas las filas de la tabla de datos, esa variable tome el tipo de valor correcto (string, int o float) dentro del conjunto en cuestión.
# Detectar valores erróneos o inconsistentes, para ello se podrían gráficar los datos de cada atributo, y ver si hay "outliers" esto también lo podríamos comprobar comparando el archivo de explicación de datos, y estudiando los intervalos posibles para cada variable, luego podría construirse un condicional que compruebe columna por columna, que todos los valores de esa columna se encuentran dentro de dicho intervalo
La siguiente tarea, podría consistir en la búsqueda de datos envejedidos y si se diese el caso, actualizar aquellos valores que indirectamente pueden suponer confusión al modelo. Se puede tomar el ejemplo visto en teoría; sustituir la edad de pacientes o víctimas, por su fecha de nacimiento. En este caso, en el fichero de accident.csv no hay ninguna edad especificada, por lo tanto implementar esta tarea no tendría mucho sentido, no obstante, aquellas variables que se hayan descalificado, se deberían de retirar del juego de datos.
La siguiente tarea podría consistir en comprobar que no hubiese variaciones en los valores que tomen las variables, es decir, que en el caso del nombre de la ciudad, del condado, el mes del año, el día de la semana y el formato horario, estén todos estos campos escritos de la misma forma, o que todos empiecen por mayúsculas, o que todos los nombres estén en mayúsculas en el caso de los 4 primeros escenarios, y que en el caso de la hora, esta tenga el mismo formato en todos los accidentes. Por lo tanto, se van a modificar aquellas celdas que representen la misma información, pero que esté escrita/especificada diferentemente. Además, se ha comprobado para el atributo TWAY_ID que en algunos accidentes, las letras del código alfanumérico que toma el atributo, están en mayúsculas y otras en minúsculas, y en algunos casos el tipo de valor que toma este atributo puede ser o alfanumérico o puede estar solamente compuesto por letras o palabras, esto supone un problema considerable a la hora de gráficar o calcular datos relativos a este atributo.
nombre_archivo = 'accident.CSV'
datos <- read.csv(nombre_archivo)
names(datos) #Aqui leemos el nombre de las columnas
## [1] "STATE" "STATENAME" "ST_CASE" "VE_TOTAL" "VE_FORMS"
## [6] "PVH_INVL" "PEDS" "PERSONS" "PERMVIT" "PERNOTMVIT"
## [11] "COUNTY" "COUNTYNAME" "CITY" "CITYNAME" "DAY"
## [16] "DAYNAME" "MONTH" "MONTHNAME" "YEAR" "DAY_WEEK"
## [21] "DAY_WEEKNAME" "HOUR" "HOURNAME" "MINUTE" "MINUTENAME"
## [26] "NHS" "NHSNAME" "ROUTE" "ROUTENAME" "TWAY_ID"
## [31] "TWAY_ID2" "RUR_URB" "RUR_URBNAME" "FUNC_SYS" "FUNC_SYSNAME"
## [36] "RD_OWNER" "RD_OWNERNAME" "MILEPT" "MILEPTNAME" "LATITUDE"
## [41] "LATITUDENAME" "LONGITUD" "LONGITUDNAME" "SP_JUR" "SP_JURNAME"
## [46] "HARM_EV" "HARM_EVNAME" "MAN_COLL" "MAN_COLLNAME" "RELJCT1"
## [51] "RELJCT1NAME" "RELJCT2" "RELJCT2NAME" "TYP_INT" "TYP_INTNAME"
## [56] "WRK_ZONE" "WRK_ZONENAME" "REL_ROAD" "REL_ROADNAME" "LGT_COND"
## [61] "LGT_CONDNAME" "WEATHER" "WEATHERNAME" "SCH_BUS" "SCH_BUSNAME"
## [66] "RAIL" "RAILNAME" "NOT_HOUR" "NOT_HOURNAME" "NOT_MIN"
## [71] "NOT_MINNAME" "ARR_HOUR" "ARR_HOURNAME" "ARR_MIN" "ARR_MINNAME"
## [76] "HOSP_HR" "HOSP_HRNAME" "HOSP_MN" "HOSP_MNNAME" "FATALS"
## [81] "DRUNK_DR"
head(datos[c("MONTH","STATENAME","COUNTYNAME","CITYNAME","RUR_URBNAME")])
## MONTH STATENAME COUNTYNAME CITYNAME RUR_URBNAME
## 1 1 Alabama ELMORE (51) NOT APPLICABLE Rural
## 2 1 Alabama JEFFERSON (73) BIRMINGHAM Urban
## 3 1 Alabama SHELBY (117) NOT APPLICABLE Rural
## 4 1 Alabama CALHOUN (15) NOT APPLICABLE Rural
## 5 1 Alabama COOSA (37) NOT APPLICABLE Rural
## 6 1 Alabama MORGAN (103) NOT APPLICABLE Rural
head(datos[c("DAY","HOUR")])
## DAY HOUR
## 1 1 2
## 2 2 17
## 3 2 14
## 4 3 15
## 5 4 0
## 6 4 16
Esto es de especial importancia, ya que a la hora de introducir estos datos en un modelo de aprendizaje automático o en cualquier modelo de detección o clasificación aunque para una persona signifiquen lo mismo, un modelo computacional interpretará que January y JANUARY son cadenas de caractéres diferentes, cuando en realidad reresentan los mismo. En este caso hemos visto como la variable MONTH es de tipo int, al igual que el condado y la ciudad, en cambio el estado es una cadena de caractéres. No obstante existen, variables relativas al nombre del condado “COUNTYNAME” y al nombre de la ciudad “CITYNAME”, que son las variables que se muestran arriba.
Observando los resultados de arriba uno se da cuenta de como, cuando se trata de un entorno rural, el nombre de la ciudad no aplica, como es lógico, por lo tanto, podría ser útil obviar una de las variables, porque las dos nos dan la misma información, pero una es más especifica, en este caso, la variable “CITYNAME” indica el nombre de la ciudad, en cambio la otra solo muestra si se trata de un entorno rural o urbano, por lo tanto se podría prescindir de la variable que determina el entorno, porque al saber el nombre de la ciudad, se sabe que ciudad es, y si no fuese una ciudad directamente mostraría un “NA”. No obstante, he decidido no eliminarla por ahora, porque para las primeras gráficas, creo que es importante mantener los entornos, para saber donde se producen más acidentes, y luego ir filtrando por ciudades.
El siguiente paso, podría consistir en analizar si los datos que hemos escogido están sesgados, y estudiar si esto repercute en nuestro objetivo principal del proyecto. En este caso, podríamos remarcar que hay un sesgo, el hecho de que todos los accidentes tengan una víctima mortal, no obstante, en principio, este sesgo no influiría negativamente en nuestro proyecto, ya que nuestro objetivo ya contempla la muerte como algo “normal” o habitual a la hora de llevar a cabo nuestro estudio. En el caso de querer hacer un estudio que no involucre muertes, se deberían de incluir esos datos, pero habría que repetir el proceso de limpieza de datos y habría que estudiar más en detalle como afectaría este sesgo al objetivo principal del proyecto.
Ahora ya se han limpiado los datos, a continuación, se podrían a empezar a graficar parte de los datos ya “limpios” mediante herramientas estadísticas, como los histogramas, que nos permiten visualizar las variaciones de los datos en cada atributo para cada accidente en concreto
unique(datos["RUR_URB"]) # Para saber cuantos valores posibles hay
## RUR_URB
## 1 1
## 2 2
## 628 6
## 994 9
## 7021 8
unique(datos["CITYNAME"])
## CITYNAME
## 1 NOT APPLICABLE
## 2 BIRMINGHAM
## 7 BESSEMER
## 10 GUNTERSVILLE
## 11 HILLSBORO
## 12 MIDFIELD
## 13 TUSCALOOSA
## 15 MALVERN
## 17 HOMEWOOD
## 19 PHENIX CITY
## 21 MOBILE
## 45 HUNTSVILLE
## 52 UNION SPRINGS
## 54 SLOCOMB
## 58 ORRVILLE
## 60 ALBERTVILLE
## 62 ADAMSVILLE
## 65 OZARK
## 68 ASHVILLE
## 82 Other
## 83 JACKSON
## 85 TALLADEGA
## 86 SHEFFIELD
## 90 CULLMAN
## 92 TRUSSVILLE
## 96 LAKEVIEW
## 102 MONTGOMERY
## 108 CLANTON
## 109 PRICHARD
## 127 AUBURN
## 128 MOULTON
## 136 VALLEY
## 138 LITTLEVILLE
## 139 KIMBERLY
## 152 DOTHAN
## 162 FORT DEPOSIT
## 165 LANETT
## 167 OPELIKA
## 178 MOUNTAIN BROOK
## 181 ENTERPRISE
## 184 SCOTTSBORO
## 197 HARTSELLE
## 206 SOUTHSIDE
## 213 ATTALLA
## 220 HOOVER
## 222 PELL CITY
## 225 LOXLEY
## 234 CAMP HILL
## 236 PRICEVILLE
## 242 PELHAM
## 257 ANNISTON
## 282 BRUNDIDGE
## 301 OXFORD
## 307 TUSKEGEE
## 313 STEVENSON
## 320 ALABASTER
## 328 GULF SHORES
## 331 CLIO
## 332 ONEONTA
## 339 OWENS CROSS ROADS
## 349 ATHENS
## 358 LAFAYETTE
## 364 CALERA
## 365 RAINSVILLE
## 370 RUTLEDGE
## 374 RUSSELLVILLE
## 383 LEEDS
## 395 TROY
## 403 PARRISH
## 419 FOLEY
## 436 NORTHPORT
## 438 HENAGAR
## 476 GADSDEN
## 480 ALEXANDER CITY
## 488 FLORENCE
## 494 JASPER
## 500 RAINBOW CITY
## 507 BOAZ
## 524 DAPHNE
## 537 BAY MINETTE
## 538 NEW HOPE
## 542 DADEVILLE
## 551 DECATUR
## 555 SATSUMA
## 581 WETUMPKA
## 592 FAIRHOPE
## 598 CENTRE
## 614 NEWTON
## 622 MAPLESVILLE
## 624 SYLACAUGA
## 633 HARPERSVILLE
## 639 EUFAULA
## 667 BREWTON
## 676 SELMA
## 678 VESTAVIA HILLS
## 720 PRATTVILLE
## 731 GLENCOE
## 736 LINCOLN
## 745 TUSCUMBIA
## 764 ORANGE BEACH
## 771 BLOUNTSVILLE
## 776 WHITE HALL
## 806 COTTONWOOD
## 814 SARALAND
## 823 EVERGREEN
## 853 PALMER
## 854 ANCHORAGE
## 855 WILLOW
## 857 DENALI
## 859 FAIRBANKS
## 860 SOLDOTNA
## 863 MOOSE PASS
## 865 MOUNTAIN VILLAGE
## 866 PORT NIKISKI
## 867 Unknown
## 869 WASILLA
## 871 GIRDWOOD
## 873 TWO RIVERS
## 874 FOX
## 875 STEBBINS
## 877 HOUSTON
## 878 CENTRAL
## 881 BODENBURG BUTTE
## 882 EAGLE RIVER
## 883 TONSINA
## 893 NORTH POLE
## 896 ESTER
## 899 HOPE
## 903 KETCHIKAN
## 905 OLD VALDEZ
## 906 PHOENIX
## 907 TUCSON
## 908 MARBLE CANYON
## 910 MANY FARMS
## 914 PRESCOTT
## 916 KINGMAN
## 917 SHOW LOW
## 919 SUPERIOR
## 920 MESA
## 921 WELLTON
## 923 YUMA
## 924 SAN MANUEL
## 925 SAN SIMON
## 927 GOODYEAR
## 932 LAKE HAVASU CITY
## 935 SCOTTSDALE
## 937 WHY
## 941 SIERRA VISTA
## 945 TUBAC
## 947 SAHUARITA
## 948 GLENDALE
## 949 GILA BEND
## 950 CONGRESS
## 951 GILBERT
## 952 SACATON
## 953 TUMACACORI
## 954 WILLCOX
## 957 MAYER
## 959 PEORIA
## 961 PAULDEN
## 962 PERIDOT
## 974 SNOWFLAKE
## 976 HOUCK
## 977 CAMP VERDE
## 980 LUPTON
## 982 WILLOW BEACH
## 983 SALOME
## 988 QUARTZSITE
## 991 TONALEA
## 992 CASA GRANDE
## 997 PARKER
## 1005 CHANDLER
## 1007 BAPCHULE
## 1015 TOLLESON
## 1016 APACHE JUNCTION
## 1024 TEMPE
## 1026 FORT THOMAS
## 1034 MUNDS PARK
## 1037 SUN CITY
## 1040 LITCHFIELD PARK
## 1044 SELIGMAN
## 1045 PIMA
## 1047 WIKIEUP
## 1065 SURPRISE
## 1067 BUCKEYE
## 1068 MOHAVE VALLEY
## 1073 LUKACHUKAI
## 1075 QUEEN CREEK
## 1080 GOLDEN VALLEY
## 1088 KIRKLAND
## 1096 PRESCOTT VALLEY
## 1097 STRAWBERRY
## 1098 CHAMBERS
## 1100 KEARNY
## 1103 PAYSON
## 1105 BYLAS
## 1113 SANDERS
## 1115 GLOBE
## 1116 SEDONA
## 1124 KYKOTSMOVI
## 1128 MCNEAL
## 1132 CORNVILLE
## 1135 TONOPAH
## 1140 LITTLEFIELD
## 1161 ORACLE
## 1167 WINKELMAN
## 1175 CHINO VALLEY
## 1192 MORMON LAKE
## 1210 YUCCA
## 1213 HOLBROOK
## 1228 COOLIDGE
## 1241 AVONDALE
## 1254 GREER
## 1259 HEBER
## 1265 PINETOP
## 1268 NUTRIOSO
## 1271 WINSLOW
## 1273 MORRISTOWN
## 1274 FLAGSTAFF
## 1276 MARANA
## 1282 HACKBERRY
## 1294 TUBA CITY
## 1295 POLACCA
## 1301 CATALINA
## 1304 CHINLE
## 1305 BULLHEAD CITY
## 1314 FOUNTAIN HILLS
## 1337 SELLS
## 1340 DILKON
## 1354 NOGALES
## 1362 DOLAN SPRINGS
## 1391 PINETOP-LAKESIDE
## 1442 DEWEY-HUMBOLDT
## 1535 FORT MCDOWELL
## 1580 ELOY
## 1611 SOMERTON
## 1632 VAIL
## 1654 AJO
## 1669 NEW RIVER
## 1705 JOSEPH CITY
## 1756 WICKENBURG
## 1823 LAVEEN
## 1864 GREEN VALLEY
## 1876 JEFFERSON
## 1880 FAYETTEVILLE
## 1885 GATEWAY
## 1886 CABOT
## 1887 HOT SPRINGS
## 1890 FORT SMITH
## 1895 CAMDEN
## 1896 JONESBORO
## 1899 LOWELL
## 1904 LITTLE ROCK
## 1909 NORTH LITTLE ROCK
## 1914 SPRINGDALE
## 1919 JACKSONVILLE
## 1921 TEXARKANA
## 1924 KEO
## 1926 CONWAY
## 1930 BENTON
## 1931 CLARKSVILLE
## 1937 WEST MEMPHIS
## 1938 PINE BLUFF
## 1947 DARDANELLE
## 1959 GARFIELD
## 1969 MORRILTON
## 1970 BRYANT
## 1981 MAGNOLIA
## 1982 NEWPORT
## 1999 BLYTHEVILLE
## 2000 DIAZ
## 2006 DUMAS
## 2024 BENTONVILLE
## 2028 LONOKE
## 2031 SALEM
## 2037 WALNUT RIDGE
## 2041 HARRISON
## 2046 SEARCY
## 2063 ROGERS
## 2067 GREEN FOREST
## 2087 MOUNTAIN VIEW
## 2114 OSCEOLA
## 2124 PORTIA
## 2128 MOUNTAIN HOME
## 2144 STUTTGART
## 2149 GOSHEN
## 2155 WILLISVILLE
## 2161 MCGEHEE
## 2166 ENGLAND
## 2167 SHERWOOD
## 2172 WYNNE
## 2175 PRATTSVILLE
## 2185 BISCOE
## 2188 EARLE
## 2194 CLINTON
## 2202 LOCKESBURG
## 2216 HAYNES
## 2222 GURDON
## 2243 CAVE CITY
## 2261 THORNTON
## 2267 BELLA VISTA
## 2278 SAINT CHARLES
## 2281 PARAGOULD
## 2301 DOVER
## 2308 MONROE
## 2314 MAYFLOWER
## 2332 FORREST CITY
## 2348 GILMORE
## 2352 GRAVETTE
## 2363 PEA RIDGE
## 2374 SILOAM SPRINGS
## 2378 COLT
## 2380 BATESVILLE
## 2383 BALD KNOB
## 2396 OAKGROVE
## 2399 CHARLESTON
## 2407 SMACKOVER
## 2408 FLIPPIN
## 2420 HAMBURG
## 2427 EL DORADO
## 2437 MARKED TREE
## 2442 VAN BUREN
## 2457 OLD COVE
## 2480 CITRUS HEIGHTS
## 2481 SACRAMENTO
## 2485 SOLANA BEACH
## 2496 BAKERSFIELD
## 2499 DIAMOND BAR
## 2506 SAN FRANCISCO
## 2508 CATHEDRAL CITY
## 2511 ONTARIO
## 2516 COMPTON
## 2527 VISTA
## 2538 SANTA CLARITA
## 2540 HIGHLAND
## 2543 LOS ANGELES
## 2544 FAIRFIELD
## 2545 SAN BERNARDINO
## 2552 BEAUMONT
## 2553 PASO ROBLES
## 2555 STOCKTON
## 2556 MANTECA
## 2562 SAN DIEGO
## 2563 SOUTH SAN FRANCISCO
## 2564 SUNNYVALE
## 2565 TURLOCK
## 2566 CLAREMONT
## 2569 RIALTO
## 2570 TULARE
## 2571 LA CA\xd1ADA FLINTRIDGE
## 2573 MILPITAS
## 2574 APPLE VALLEY
## 2577 RANCHO CORDOVA
## 2581 MONTCLAIR
## 2582 OAKLAND
## 2587 ENCINITAS
## 2596 HUNTINGTON PARK
## 2599 SANTA ANA
## 2600 BERKELEY
## 2601 ESCONDIDO
## 2604 SAN MATEO
## 2605 LAKEWOOD
## 2606 LA HABRA
## 2608 LA PALMA
## 2626 FONTANA
## 2629 LA MESA
## 2631 LANCASTER
## 2646 MODESTO
## 2647 LEMON GROVE
## 2665 GALT
## 2668 NOVATO
## 2670 CAMPBELL
## 2671 HESPERIA
## 2675 PALMDALE
## 2678 HERCULES
## 2688 REDDING
## 2703 ELK GROVE
## 2704 NAPA
## 2710 REDLANDS
## 2714 CHINO
## 2716 SANTA ROSA
## 2726 INGLEWOOD
## 2730 PITTSBURG
## 2733 MORENO VALLEY
## 2739 EAST IRVINE
## 2743 ANAHEIM
## 2753 PLEASANTON
## 2763 SAN RAMON
## 2770 MONROVIA
## 2772 COSTA MESA
## 2775 UNION CITY
## 2778 CORONA
## 2797 WESTMINSTER
## 2801 RANCHO CUCAMONGA
## 2805 RIVERSIDE
## 2835 DAVIS
## 2837 SAN JOSE
## 2840 REDWOOD CITY
## 2851 SAN LEANDRO
## 2853 IRWINDALE
## 2857 GILROY
## 2873 THOUSAND OAKS
## 2874 VICTORVILLE
## 2883 SIMI VALLEY
## 2895 WOODLAND
## 2899 SALINAS
## 2913 BLYTHE
## 2915 TORRANCE
## 2924 MENIFEE
## 2926 SEAL BEACH
## 2936 BALDWIN PARK
## 2944 ORANGE
## 2947 DANVILLE
## 2951 BURLINGAME
## 2953 OXNARD
## 2960 Not Reported
## 2963 PALO ALTO
## 2965 PICO RIVERA
## 2966 TEMECULA
## 2971 CARLSBAD
## 2979 SAN MARCOS
## 2980 LONG BEACH
## 2984 MARINA
## 2985 GROVER BEACH
## 2986 PACIFICA
## 2988 ROSEVILLE
## 2996 FRESNO
## 2997 NEWPORT BEACH
## 3010 SAN JUAN CAPISTRANO
## 3031 EUREKA
## 3038 LAGUNA HILLS
## 3040 LODI
## 3049 ANTIOCH
## 3050 VACAVILLE
## 3072 BELLFLOWER
## 3075 RIDGECREST
## 3080 CERRITOS
## 3092 LIVERMORE
## 3094 MERCED
## 3104 WILDOMAR
## 3107 OCEANSIDE
## 3111 INDIO
## 3112 GARDEN GROVE
## 3114 TRACY
## 3116 NEWARK
## 3122 EL CAJON
## 3123 VENTURA
## 3125 MORGAN HILL
## 3138 IMPERIAL BEACH
## 3144 SAN JACINTO
## 3145 CHULA VISTA
## 3146 POMONA
## 3148 BRENTWOOD
## 3149 CLOVIS
## 3158 NORWALK
## 3161 ALAMEDA
## 3162 RICHMOND
## 3171 LOMITA
## 3173 ORINDA
## 3182 FAIRFAX
## 3189 SAN LUIS OBISPO
## 3190 SAN YSIDRO
## 3192 SHAFTER
## 3195 PERRIS
## 3201 FULLERTON
## 3218 FOUNTAIN VALLEY
## 3221 AZUSA
## 3222 HEMET
## 3230 DESERT HOT SPRINGS
## 3240 DOWNEY
## 3243 HUNTINGTON BEACH
## 3244 YUCCA VALLEY
## 3261 TWENTYNINE PALMS
## 3272 PARAMOUNT
## 3275 OROVILLE
## 3278 CARSON
## 3280 SANTA MARIA
## 3282 PORTERVILLE
## 3292 PARADISE
## 3295 WATSONVILLE
## 3296 SANTA FE SPRINGS
## 3310 LATHROP
## 3313 VALLEJO
## 3316 CHICO
## 3325 FREMONT
## 3326 SAN PABLO
## 3331 LYNWOOD
## 3332 CARPINTERIA
## 3351 WEST SACRAMENTO
## 3361 FARMERSVILLE
## 3369 BARSTOW
## 3372 DINUBA
## 3375 CALIFORNIA CITY
## 3386 MALIBU
## 3399 NORTH PALM SPRINGS
## 3401 LA VERNE
## 3409 COLTON
## 3416 YUBA CITY
## 3417 VISALIA
## 3425 STANTON
## 3426 ANDERSON
## 3428 SANGER
## 3453 KNIGHTSEN
## 3457 TEHACHAPI
## 3462 LOS ALTOS HILLS
## 3467 HAYWARD
## 3469 SAN CLEMENTE
## 3477 WEST COVINA
## 3489 ALHAMBRA
## 3512 PASADENA
## 3514 TUSTIN
## 3524 CLAYTON
## 3527 PLEASANT HILL
## 3543 BUENA PARK
## 3551 FERNDALE
## 3559 SONOMA
## 3564 LOS ALTOS
## 3568 WINDSOR
## 3593 HAWTHORNE
## 3611 SANTA CLARA
## 3614 CONCORD
## 3638 ATASCADERO
## 3672 SOUTH GATE
## 3719 BANNING
## 3740 COMMERCE
## 3746 RIPON
## 3758 BELL
## 3764 KINGSBURG
## 3770 PLACENTIA
## 3794 GRASS VALLEY
## 3810 MENLO PARK
## 3864 VERNON
## 3865 NATIONAL CITY
## 3869 LAKE ELSINORE
## 3876 WINTERS
## 3895 LAGUNA NIGUEL
## 3910 YUCAIPA
## 3919 LA MIRADA
## 3959 AMERICAN CANYON
## 3976 COACHELLA
## 4016 NEEDLES
## 4017 MARTINEZ
## 4098 DANA POINT
## 4112 PALM DESERT
## 4135 SANTA CRUZ
## 4186 WALNUT CREEK
## 4242 ROSEMEAD
## 4243 NORCO
## 4244 HOLLISTER
## 4252 CULVER CITY
## 4274 UPLAND
## 4278 FOSTER CITY
## 4329 FOLSOM
## 4373 ADELANTO
## 4412 MOORPARK
## 4479 PETALUMA
## 4514 WOODSIDE
## 4542 LA QUINTA
## 4577 SUSANVILLE
## 4586 WASCO
## 4602 MONTEREY PARK
## 4614 CERES
## 4617 BRAWLEY
## 4691 MADERA
## 4785 MISSION VIEJO
## 4848 CLEARLAKE
## 4863 ARROYO GRANDE
## 4866 SAN BRUNO
## 4883 CUPERTINO
## 4915 SUTTER CREEK
## 4956 DELANO
## 4957 EAST PALO ALTO
## 5002 REEDLEY
## 5014 GLENDORA
## 5023 WHITTIER
## 5028 INDUSTRY
## 5032 CARDIFF BY THE SEA
## 5066 PLACERVILLE
## 5093 RED BLUFF
## 5103 MILLBRAE
## 5126 AVENAL
## 5152 SAN GABRIEL
## 5159 CHINO HILLS
## 5175 SAN DIMAS
## 5176 LOOMIS
## 5177 GARDENA
## 5182 CHATSWORTH
## 5255 CYPRESS
## 5272 SOUTH LAKE TAHOE
## 5279 MURRIETA
## 5283 OJAI
## 5351 DIXON
## 5354 SOUTH EL MONTE
## 5355 GOLETA
## 5397 CALABASAS
## 5407 MARYSVILLE
## 5446 EL MONTE
## 5447 ATHERTON
## 5451 SCOTTS VALLEY
## 5466 REDONDO BEACH
## 5477 BELL GARDENS
## 5488 SANTA PAULA
## 5503 LEMOORE
## 5511 BIG BEAR LAKE
## 5534 LOS BANOS
## 5580 BURBANK
## 5588 GONZALES
## 5592 ARVIN
## 5636 DUARTE
## 5682 MONTEBELLO
## 5685 WESTLAKE VILLAGE
## 5693 COTATI
## 5695 EL CENTRO
## 5733 DALY CITY
## 5747 SANTA BARBARA
## 5803 PATTERSON
## 5830 RIVERBANK
## 5834 CALEXICO
## 5838 GRAND TERRACE
## 5885 SARATOGA
## 5890 TAFT
## 5894 MENDOTA
## 5918 HURON
## 5939 WILLOWS
## 5961 WATERFORD
## 5992 COVINA
## 5993 RANCHO SANTA MARGARITA
## 5997 LAKE FOREST
## 6020 AURORA
## 6021 COLORADO SPRINGS
## 6022 FORT MORGAN
## 6023 PEETZ
## 6025 BOULDER
## 6027 FOUNTAIN
## 6032 DENVER
## 6045 LOVELAND
## 6047 RIFLE
## 6061 CASTLE ROCK
## 6064 FORT COLLINS
## 6065 COLUMBINE VALLEY
## 6069 CHERRY HILLS VILLAGE
## 6072 CENTENNIAL
## 6076 WHEAT RIDGE
## 6088 GREELEY
## 6093 ARVADA
## 6098 CA\xd1ON CITY
## 6112 ASPEN
## 6116 PUEBLO
## 6117 MONTROSE
## 6123 GRAND JUNCTION
## 6154 PUEBLO WEST
## 6166 BRIGHTON
## 6179 BROOMFIELD
## 6189 PLATTEVILLE
## 6193 AULT
## 6195 BRUSH
## 6196 MEAD
## 6197 CORTEZ
## 6204 OAK CREEK
## 6216 GREENWOOD VILLAGE
## 6243 ENGLEWOOD
## 6247 ELBERT
## 6248 SILT
## 6254 FREDERICK
## 6257 WESTCLIFFE
## 6258 FORT LUPTON
## 6281 WOODLAND PARK
## 6335 EDGEWATER
## 6341 LONGMONT
## 6344 COMMERCE CITY
## 6377 DACONO
## 6383 NORTHGLENN
## 6396 MILNER
## 6437 FIRESTONE
## 6440 ESTES PARK
## 6448 MORRISON
## 6465 WALSENBURG
## 6486 LITTLETON
## 6526 LOUISVILLE
## 6534 OLATHE
## 6536 FEDERAL HEIGHTS
## 6560 GOLDEN
## 6575 EVANS
## 6580 MILLIKEN
## 6583 ALAMOSA
## 6590 MANCHESTER
## 6591 SHELTON
## 6592 AVON
## 6593 BRISTOL
## 6594 NORTH COVENTRY
## 6595 HARTFORD
## 6596 NEW HAVEN
## 6600 PUTNAM
## 6601 WEST HAVEN
## 6602 WOODBRIDGE
## 6605 TRUMBULL
## 6606 NEWTOWN
## 6607 FRANKLIN
## 6608 LEBANON
## 6609 KILLINGLY CENTER
## 6610 COLCHESTER
## 6611 BURLINGTON
## 6613 UNION
## 6614 WILLINGTON HILL
## 6615 PRESTON
## 6616 NORWICH
## 6617 NORTH HAVEN
## 6618 GLASTONBURY
## 6619 WESTBROOK
## 6620 COLUMBIA
## 6621 MIDDLETOWN
## 6622 CROMWELL
## 6624 BRIDGEPORT
## 6625 WALLINGFORD
## 6626 NORTH BRANFORD
## 6630 MANSFIELD CENTER
## 6631 NEW BRITAIN
## 6635 MIDDLEBURY
## 6639 HAMDEN
## 6641 BLOOMFIELD
## 6642 WEST HARTFORD
## 6643 DURHAM
## 6644 ROCKY HILL
## 6647 DERBY
## 6650 RIDGEFIELD
## 6654 STONINGTON
## 6655 EAST HAVEN
## 6657 SOUTHINGTON
## 6658 GREENWICH
## 6659 ENFIELD
## 6660 TOLLAND
## 6661 BRANFORD
## 6662 WATERBURY
## 6664 GROTON
## 6666 NORTH CANAAN
## 6672 WINCHESTER CENTER
## 6674 BEACON FALLS
## 6677 CHESHIRE
## 6678 LITCHFIELD
## 6679 EAST WINDSOR (HISTORICAL)
## 6681 MERIDEN
## 6683 BOLTON
## 6685 THOMPSON
## 6688 MADISON
## 6694 HADDAM
## 6695 DANBURY
## 6704 WATERTOWN
## 6705 OLD LYME
## 6706 STAMFORD
## 6707 WESTON
## 6709 WEST TORRINGTON
## 6714 STRATFORD
## 6715 FLANDERS
## 6716 NEWINGTON
## 6717 CANTERBURY
## 6718 WAUREGAN
## 6721 SEYMOUR
## 6723 WESTPORT
## 6725 EAST HARTFORD
## 6728 SOMERS
## 6737 THOMASTON
## 6748 PROSPECT
## 6753 SIMSBURY
## 6763 SHARON
## 6767 BROOKFIELD
## 6771 POMFRET
## 6773 WETHERSFIELD
## 6780 ANSONIA
## 6782 SOUTHBURY
## 6798 CHAPLIN
## 6799 NORTH STONINGTON
## 6801 WOODBURY
## 6803 SOUTH WINDSOR
## 6810 NEW MILFORD
## 6813 MILFORD
## 6817 PORTLAND
## 6835 WINDHAM
## 6837 EASTON
## 6843 NEW HARTFORD
## 6860 JORDAN
## 6875 NEW CASTLE
## 6884 GEORGETOWN
## 6895 WILMINGTON
## 6917 HOCKESSIN
## 6921 HARRINGTON
## 6922 SMYRNA
## 6924 CLAYMONT
## 6927 MILTON
## 6929 ODESSA
## 6931 BRIDGEVILLE
## 6932 SELBYVILLE
## 6934 HARTLY
## 6935 LAUREL
## 6939 ARDEN
## 6941 ELSMERE
## 6945 VIOLA
## 6956 MILLSBORO
## 6957 DELAWARE CITY
## 6964 ELLENDALE
## 6973 WASHINGTON
## 7007 LAKE WALES
## 7013 LARGO
## 7016 WEST PALM BEACH
## 7018 MIAMI SPRINGS
## 7024 COCOA
## 7028 BOCA RATON
## 7029 ORLANDO
## 7031 HOLLYWOOD
## 7032 MIAMI
## 7046 STUART
## 7049 NORTH PORT
## 7050 MARCO
## 7070 CASSELBERRY
## 7072 PORT ORANGE
## 7079 TAMPA
## 7081 HAINES CITY
## 7084 VERO BEACH
## 7085 AUBURNDALE
## 7096 OPA-LOCKA
## 7105 SAINT PETERSBURG
## 7110 LAKELAND
## 7115 HIALEAH
## 7116 FORT LAUDERDALE
## 7117 DELTONA
## 7132 CORAL SPRINGS
## 7139 NEW PORT RICHEY
## 7141 PEMBROKE PINES
## 7150 HALLANDALE BEACH
## 7151 JACKSONVILLE BEACH
## 7153 SUNRISE
## 7155 POMPANO BEACH
## 7158 GAINESVILLE
## 7172 DEBARY
## 7173 COCONUT CREEK
## 7199 ZEPHYRHILLS
## 7201 TARPON SPRINGS
## 7204 ALACHUA
## 7205 TALLAHASSEE
## 7212 KEY LARGO
## 7214 DAVIE
## 7215 DELAND
## 7233 MIAMI GARDENS
## 7238 OCOEE
## 7240 CAPE CORAL
## 7244 TAMARAC
## 7246 PALM COAST
## 7256 BOYNTON BEACH
## 7260 WINTER HAVEN
## 7273 PLANT CITY
## 7277 CLEWISTON
## 7278 MIRAMAR
## 7279 WILDWOOD
## 7289 MELBOURNE
## 7294 ORANGE CITY
## 7310 DAYTONA BEACH
## 7339 PENSACOLA
## 7365 PALM BAY
## 7370 PALM SPRINGS
## 7373 LEESBURG
## 7386 FORT PIERCE
## 7398 TREASURE ISLAND
## 7405 HAMMONDVILLE
## 7411 MIAMI BEACH
## 7415 SPRINGFIELD
## 7438 OCALA
## 7441 FORT MYERS
## 7449 APOPKA
## 7456 ORMOND BEACH
## 7470 VENICE
## 7475 MIMS
## 7487 MASCOTTE
## 7513 MARIANNA
## 7515 ATLANTIS
## 7522 CHIEFLAND
## 7540 BELLE GLADE
## 7550 DANIA BEACH
## 7553 BRADENTON
## 7563 KISSIMMEE
## 7566 SARASOTA
## 7567 TITUSVILLE
## 7582 NORTH MIAMI
## 7586 PINELLAS PARK
## 7601 EUSTIS
## 7603 BARTOW
## 7620 BELLEVIEW
## 7631 OAKLAND PARK
## 7642 BONITA SPRINGS
## 7648 TAVARES
## 7659 PANAMA CITY
## 7681 LAUDERHILL
## 7695 WINTER PARK
## 7738 ARCADIA
## 7761 HOLLY HILL
## 7767 SAINT CLOUD
## 7801 WEST BRADENTON
## 7811 ALTAMONTE SPRINGS
## 7819 CLERMONT
## 7829 WESTVILLE
## 7840 LAUDERDALE LAKES
## 7846 LONGWOOD
## 7847 FERNANDINA BEACH
## 7861 DORAL
## 7887 DE FUNIAK SPRINGS
## 7891 DESTIN
## 7931 WEST MELBOURNE
## 7936 IMMOKALEE
## 7977 BROOKSVILLE
## 7985 FROSTPROOF
## 7986 MULBERRY
## 7987 PALM BEACH GARDENS
## 7988 DELRAY BEACH
## 7992 DEERFIELD BEACH
## 7995 PLANTATION
## 8091 SANFORD
## 8109 COCOA BEACH
## 8117 CRESTVIEW
## 8133 LAKE WORTH
## 8190 PORT RICHEY
## 8199 NARANJA
## 8200 PORT SAINT JOE
## 8210 LAUDERDALE-BY-THE-SEA
## 8212 PALMETTO BAY
## 8219 FLORIDA CITY
## 8235 MEDLEY
## 8255 NAPLES
## 8260 GREENACRES CITY
## 8261 LOXAHATCHEE GROVES
## 8269 OTTER CREEK
## 8272 CLEARWATER
## 8388 DADE CITY
## 8389 DUNEDIN
## 8434 ISLAMORADA
## 8488 NEW SMYRNA BEACH
## 8494 LAKE PLACID
## 8510 PORT SAINT LUCIE
## 8548 MIDWAY
## 8596 PALATKA
## 8619 NORTH LAUDERDALE
## 8683 PANAMA CITY BEACH
## 8689 NORTH PALM BEACH
## 8743 WHITE SPRINGS
## 8767 JUPITER
## 8778 OVIEDO
## 8790 ROYAL PALM BEACH
## 8791 SOUTH MIAMI
## 8830 WINTER GARDEN
## 8836 GRAND RIDGE
## 8894 LIGHTHOUSE POINT
## 8917 LAKE BUTLER
## 8919 COOPER CITY
## 8920 MOUNT DORA
## 8956 LAKE HELEN
## 8993 LANTANA
## 8996 LEHIGH ACRES
## 9013 HOMESTEAD
## 9022 PIERSON
## 9032 VIRGINIA GARDENS
## 9081 WAUCHULA
## 9155 SAINT AUGUSTINE
## 9170 MIAMI SHORES
## 9230 LADY LAKE
## 9254 MARATHON
## 9258 NORTH MIAMI BEACH
## 9297 TEMPLE TERRACE
## 9305 LAKE CITY
## 9318 HAVANA
## 9367 EBRO
## 9387 MAITLAND
## 9425 AVENTURA
## 9470 SOUTH BAY
## 9524 RIVIERA BEACH
## 9595 CRYSTAL RIVER
## 9604 LAKE PARK
## 9606 SOUTH DAYTONA
## 9611 FORT WALTON BEACH
## 9637 WALDO
## 9648 MERRITT ISLAND
## 9649 SUNNY ISLES BEACH
## 9702 MADEIRA BEACH
## 9756 LAWTEY
## 9757 INVERNESS
## 9776 LIVE OAK
## 9792 MANALAPAN
## 9900 SOUTHWEST RANCHES
## 9933 CHATTAHOOCHEE
## 9971 HIALEAH GARDENS
## 10061 CUTLER BAY
## 10077 HIGH SPRINGS
## 10079 KEY WEST
## 10082 CALLAWAY
## 10083 PALM BEACH
## 10090 KEY BISCAYNE
## 10092 BAL HARBOUR
## 10097 PUNTA GORDA
## 10105 MARIETTA
## 10108 BETHLEHEM
## 10111 VIDALIA
## 10116 MCDONOUGH
## 10117 LOGANVILLE
## 10118 WARWICK
## 10120 ATLANTA
## 10124 RINGGOLD
## 10129 BUCHANAN
## 10132 LILBURN
## 10150 PEACHTREE CITY
## 10159 GUYTON
## 10163 DEMOREST
## 10167 SUWANEE
## 10168 LULA
## 10170 STATESBORO
## 10179 CAIRO
## 10180 MACON
## 10181 SAVANNAH
## 10187 WAYCROSS
## 10191 DALLAS
## 10194 FOREST PARK
## 10197 GREENVILLE
## 10198 BLACKSHEAR
## 10200 BRUNSWICK
## 10202 STOCKBRIDGE
## 10211 POWDER SPRINGS
## 10226 COLLEGE PARK
## 10231 KENNESAW
## 10232 COLUMBUS
## 10234 HINESVILLE
## 10235 ALBANY
## 10236 BLUFFTON
## 10238 CONYERS
## 10241 FORSYTH
## 10257 DOUGLAS
## 10260 MILLEDGEVILLE
## 10289 TUCKER
## 10297 BYRON
## 10299 WRENS
## 10304 WOODSTOCK
## 10313 WARNER ROBINS
## 10319 HEPHZIBAH
## 10325 FORT STEWART
## 10335 CARROLLTON
## 10370 CEDARTOWN
## 10373 BLUE RIDGE
## 10374 TRION
## 10387 NORCROSS
## 10394 RICHMOND HILL
## 10411 MIDVILLE
## 10413 CARTERSVILLE
## 10427 STATHAM
## 10439 HAZLEHURST
## 10447 DARIEN
## 10452 COVINGTON
## 10459 WILLIAMSON
## 10463 AUGUSTA
## 10468 DOUGLASVILLE
## 10472 VALDOSTA
## 10479 SANDY SPRINGS
## 10501 RIVERDALE
## 10506 LUDOWICI
## 10511 VILLA RICA
## 10514 EAST DUBLIN
## 10516 MONTEZUMA
## 10534 DUNWOODY
## 10560 EATONTON
## 10568 MOUNTAIN CITY
## 10571 EAST POINT
## 10600 MORROW
## 10601 DUBLIN
## 10612 SNELLVILLE
## 10637 LIZELLA
## 10653 ALPHARETTA
## 10663 WEST POINT
## 10666 BUTLER
## 10678 CUMMING
## 10702 EMERSON
## 10708 BRASELTON
## 10718 BOWDON
## 10721 LAWRENCEVILLE
## 10724 ALAPAHA
## 10727 POOLER
## 10732 CORDELE
## 10740 STONE MOUNTAIN
## 10744 LITHONIA
## 10750 AUSTELL
## 10751 DACULA
## 10762 HIRAM
## 10767 DONALSONVILLE
## 10790 KINGSLAND
## 10805 GRIFFIN
## 10815 MONTICELLO
## 10831 BRIDGEBORO
## 10832 APPLING
## 10835 HARTWELL
## 10838 SENOIA
## 10865 NORWOOD
## 10868 CLEVELAND
## 10870 OAKWOOD
## 10872 DALTON
## 10875 OGLETHORPE
## 10881 BOGART
## 10882 NEWNAN
## 10888 BREMEN
## 10890 MINERAL BLUFF
## 10892 SUCHES
## 10901 CHAMBLEE
## 10909 FAIRBURN
## 10910 CARL
## 10914 PINEHURST
## 10945 RICEBORO
## 10961 ROSWELL
## 10976 HOLLY SPRINGS
## 10989 ROME
## 10998 HAMPTON
## 11018 DAWSON
## 11026 SPARKS
## 11028 WAYNESBORO
## 11038 TENNILLE
## 11039 SAUTEE NACOOCHEE
## 11040 TALKING ROCK
## 11044 DANIELSVILLE
## 11051 TALLAPOOSA
## 11084 CANTON
## 11128 ADEL
## 11143 PULASKI
## 11155 MOULTRIE
## 11161 PORT WENTWORTH
## 11175 ELBERTON
## 11201 DORAVILLE
## 11208 ROCKMART
## 11249 CLAXTON
## 11251 WALTHOURVILLE
## 11254 LYONS
## 11262 MCCAYSVILLE
## 11264 SPARTA
## 11277 CUSSETA
## 11295 TYBEE ISLAND
## 11330 BROXTON
## 11343 HOGANSVILLE
## 11344 NORMAN PARK
## 11364 SUMMERVILLE
## 11367 LOCUST GROVE
## 11374 COHUTTA
## 11383 ELLIJAY
## 11393 REIDSVILLE
## 11404 CHICKAMAUGA
## 11406 DAHLONEGA
## 11408 LINCOLNTON
## 11409 CAMILLA
## 11421 SYLVANIA
## 11426 ELLABELL
## 11437 TIFTON
## 11441 CLARKESVILLE
## 11453 HULL
## 11458 VIENNA
## 11461 LUMPKIN
## 11463 CASSVILLE
## 11470 MARTIN
## 11471 BALL GROUND
## 11477 FLOWERY BRANCH
## 11480 MCINTYRE
## 11485 THOMSON
## 11489 LAVONIA
## 11493 NICHOLLS
## 11560 ACWORTH
## 11573 LA GRANGE
## 11578 DRY BRANCH
## 11593 DAWSONVILLE
## 11627 HANAPEPE
## 11629 MAUI ISLAND
## 11630 MILILANI TOWN
## 11631 KIHEI
## 11632 \x91EWA BEACH
## 11633 KAILUA
## 11634 WAIPI\x91O ACRES
## 11635 KEA\x91AU
## 11636 PAHOA
## 11637 MA\x91ILI
## 11638 KAILUA KONA
## 11640 WAIKOLOA VILLAGE
## 11641 HONOLULU
## 11643 WAIALUA
## 11644 KAPULEI
## 11645 KAPOLEI
## 11649 HOLUALOA
## 11652 WAHIAWA
## 11653 MA\x91ALAEA
## 11654 WAIPAHU
## 11655 HILO
## 11656 HALE\x91IWA
## 11659 KANE\x91OHE
## 11660 \x91AIEA
## 11664 KAHULUI
## 11666 LIHU\x91E
## 11669 KOLOA
## 11670 LAWA\x91I
## 11671 PRINCEVILLE
## 11674 LA\x91IE
## 11687 PEARL CITY
## 11688 NANAKULI
## 11699 WAI\x91ANAE
## 11702 PUKALANI
## 11706 HA\x91IKU
## 11718 POST FALLS
## 11722 LEWISTON
## 11723 BOISE
## 11724 HORSESHOE BEND
## 11725 BONNERS FERRY
## 11726 NAMPA
## 11740 MERIDIAN
## 11744 NOTUS
## 11747 CALDWELL
## 11755 TWIN FALLS
## 11762 RIGBY
## 11810 PAYETTE
## 11815 SHOSHONE
## 11822 SPIRIT LAKE
## 11823 JEROME
## 11824 IDAHO FALLS
## 11852 COEUR D'ALENE
## 11863 EAGLE
## 11877 FORT HALL
## 11892 POCATELLO
## 11895 HAYDEN
## 11896 OLYMPIA FIELDS
## 11899 SCHILLER PARK
## 11900 ARLINGTON HEIGHTS
## 11902 GERMANTOWN
## 11905 WAUKEGAN
## 11906 HERRIN
## 11908 MOLINE
## 11912 CHICAGO
## 11915 MATTESON
## 11916 EAST SAINT LOUIS
## 11923 PLAINFIELD
## 11930 MILLINGTON
## 11931 NORTH CHICAGO
## 11937 MUNDELEIN
## 11942 WEST CHICAGO
## 11944 CHAMPAIGN
## 11946 SCHAUMBURG
## 11949 SOUTH ROXANA
## 11953 MAYWOOD
## 11961 PALATINE
## 11966 PERU
## 11967 GLEN ELLYN
## 11969 COUNTRY CLUB HILLS
## 11970 ROCKFORD
## 11971 MIDLOTHIAN
## 11972 WEST FRANKFORT
## 11974 O'FALLON
## 11976 DES PLAINES
## 11978 URBANA
## 11980 BOLINGBROOK
## 11982 WINCHESTER
## 11984 METROPOLIS
## 11986 ROSEMONT
## 11991 LAKE BARRINGTON
## 11992 NAPERVILLE
## 12001 ALTON
## 12003 WAUCONDA
## 12004 OTTAWA
## 12008 CHILLICOTHE
## 12017 CARBONDALE
## 12022 BROWNING
## 12028 FAIRVIEW HEIGHTS
## 12031 NORTHFIELD
## 12032 ROSELLE
## 12039 ZION
## 12040 GRANITE CITY
## 12044 JOLIET
## 12046 SHOREWOOD
## 12048 BELLEVILLE
## 12051 GRIDLEY
## 12053 CENTREVILLE
## 12054 GRAYSLAKE
## 12057 LOVES PARK
## 12063 PALOS HEIGHTS
## 12066 BERWYN
## 12069 YORKVILLE
## 12074 BLOOMINGTON
## 12075 CHICAGO HEIGHTS
## 12076 ORLAND PARK
## 12081 CICERO
## 12089 CALUMET CITY
## 12093 HANOVER PARK
## 12096 SWANSEA
## 12103 SKOKIE
## 12106 ELMWOOD PARK
## 12108 MAHOMET
## 12116 FULTON
## 12121 WESTERN SPRINGS
## 12127 NORTHLAKE
## 12135 WINFIELD
## 12136 ELMHURST
## 12138 WHEELING
## 12139 WADSWORTH
## 12143 DOLTON
## 12147 LOCKPORT
## 12151 ROCK ISLAND
## 12153 MATTOON
## 12156 WOOD DALE
## 12160 LANSING
## 12164 HINSDALE
## 12174 HARVEY
## 12185 NILES
## 12186 HOMER GLEN
## 12200 OLNEY
## 12201 CREST HILL
## 12202 BRADLEY
## 12203 PLANO
## 12209 SOUTH HOLLAND
## 12217 QUINCY
## 12225 GLENVIEW
## 12234 GODFREY
## 12241 CAROL STREAM
## 12244 ROLLING MEADOWS
## 12258 CARMI
## 12266 DALLAS CITY
## 12269 MARION
## 12291 CHICAGO RIDGE
## 12292 ELGIN
## 12293 ROMEOVILLE
## 12294 MARKHAM
## 12295 BUFFALO GROVE
## 12300 UNIVERSITY PARK
## 12304 STREATOR
## 12313 BEACH
## 12319 EDWARDSVILLE
## 12322 OAKDALE
## 12333 WOODRIDGE
## 12337 PARK CITY
## 12338 MOUNT PULASKI
## 12343 LOMBARD
## 12351 ADDISON
## 12363 MELROSE PARK
## 12369 BENSENVILLE
## 12372 HINDSBORO
## 12375 VANDALIA
## 12377 PONTOON BEACH
## 12385 TINLEY PARK
## 12389 TRENTON
## 12396 CRETE
## 12400 SAUGET
## 12425 SUGAR GROVE
## 12427 DOWNERS GROVE
## 12438 LONG GROVE
## 12442 SOUTH CHICAGO HEIGHTS
## 12443 WHEATON
## 12448 KANKAKEE
## 12450 MITCHELL
## 12470 BANNOCKBURN
## 12478 LIVINGSTON
## 12480 SAVANNA
## 12484 GENEVA
## 12494 HILLSIDE
## 12495 PIERRON
## 12497 CRYSTAL LAKE
## 12498 OAK LAWN
## 12504 DIETERICH
## 12505 TOLONO
## 12513 BARTONVILLE
## 12516 GENOA
## 12532 MARENGO
## 12535 CHANNAHON
## 12546 PALESTINE
## 12548 BOURBONNAIS
## 12550 RIVER FOREST
## 12554 HOMER TOWNSHIP
## 12561 PRINCETON
## 12568 PEKIN
## 12573 ELIZABETH
## 12574 MARSHALL
## 12580 BLUE MOUND
## 12582 POSEN
## 12584 LIBERTYVILLE
## 12587 BELLWOOD
## 12589 PEOTONE
## 12592 NEW HOLLAND
## 12595 MOUNT VERNON
## 12597 TOULON
## 12604 ARGENTA
## 12610 BELVIDERE
## 12614 EVANSVILLE
## 12616 EL PASO
## 12617 ROUND LAKE
## 12619 MOUNDS
## 12625 SYCAMORE
## 12626 OREGON
## 12627 CALUMET PARK
## 12628 POCAHONTAS
## 12631 CASEYVILLE
## 12639 OAK FOREST
## 12643 FRANKFORT
## 12645 SENECA
## 12648 OKAWVILLE
## 12651 MARTINSVILLE
## 12653 STREAMWOOD
## 12658 WELDON
## 12659 GURNEE
## 12663 SOUTH BELOIT
## 12665 FOREST VIEW
## 12666 MONEE
## 12669 PLAINVIEW
## 12670 STEGER
## 12691 SOUTH BARRINGTON
## 12692 BEDFORD PARK
## 12703 MINOOKA
## 12707 OAKBROOK TERRACE
## 12708 SPRING BAY
## 12712 MEDORA
## 12720 WOOSUNG
## 12724 CAHOKIA
## 12728 MORTON GROVE
## 12733 EAST DUNDEE
## 12735 MACHESNEY PARK
## 12736 BARTLETT
## 12737 LISLE
## 12746 COLLINSVILLE
## 12753 CENTRALIA
## 12760 ILLIOPOLIS
## 12763 ROANOKE
## 12765 MOUNT PROSPECT
## 12777 BLUE ISLAND
## 12780 BRIDGEVIEW
## 12789 HAZEL CREST
## 12794 EAST PEORIA
## 12801 GALESBURG
## 12816 WILLOW SPRINGS
## 12833 LIBERTY
## 12840 NORMAL
## 12842 RICHTON PARK
## 12851 MAROA
## 12858 OAK PARK
## 12865 ROSCOE
## 12868 CLAY CITY
## 12871 VILLA PARK
## 12876 DEER GROVE
## 12877 SAUK VILLAGE
## 12879 PITTSFIELD
## 12884 OGLESBY
## 12895 BRIMFIELD
## 12896 SHILOH
## 12901 KEWANEE
## 12905 CAZENOVIA
## 12908 HOFFMAN ESTATES
## 12909 KINMUNDY
## 12914 IRVINGTON
## 12926 MORRIS
## 12939 EFFINGHAM
## 12940 EAST MOLINE
## 12943 STEELEVILLE
## 12957 LEMONT
## 12963 NAUVOO
## 12967 ODIN
## 12984 NORTH VERNON
## 12988 COLUMBIA CITY
## 12989 TIPTON
## 12990 AUSTIN
## 12991 AKRON
## 12996 MOORESVILLE
## 12998 FORT WAYNE
## 12999 FRANCESVILLE
## 13000 NEWBURGH
## 13006 INDIANAPOLIS
## 13010 EAST CHICAGO
## 13012 CRAWFORDSVILLE
## 13018 WEST TERRE HAUTE
## 13020 MERRILLVILLE
## 13023 SYRACUSE
## 13030 HAMMOND
## 13032 HOBART
## 13037 NEW ALBANY
## 13042 MISHAWAKA
## 13050 MICHIGAN CITY
## 13053 ALBION
## 13055 PORTAGE
## 13056 NORTH JUDSON
## 13061 VALPARAISO
## 13068 GREENWOOD
## 13072 GARY
## 13075 FOWLERTON
## 13085 ROME CITY
## 13116 BEECH GROVE
## 13119 BURNS HARBOR
## 13126 BROOKVILLE
## 13127 LAWRENCE
## 13129 CHARLESTOWN
## 13134 BROWNSBURG
## 13137 CULVER
## 13141 MUNCIE
## 13142 GAS CITY
## 13145 SHIPSHEWANA
## 13146 SALTILLO
## 13147 TERRE HAUTE
## 13149 ALLENDALE
## 13151 HARTFORD CITY
## 13152 ARGOS
## 13160 SAINT JOHN
## 13163 SOUTH BEND
## 13169 SELLERSBURG
## 13170 CADIZ
## 13171 PLYMOUTH
## 13173 BRAZIL
## 13187 ELWOOD
## 13201 VINCENNES
## 13217 KITCHEL
## 13218 FOWLER
## 13233 KOKOMO
## 13240 CARMEL
## 13255 SCHERERVILLE
## 13256 ELKHART
## 13264 SHERIDAN
## 13272 GRIFFITH
## 13275 PORTER
## 13283 JEFFERSONVILLE
## 13290 NAPPANEE
## 13292 HAMLET
## 13293 SUMMITVILLE
## 13324 FISHERS
## 13325 CORYDON
## 13337 CROWN POINT
## 13354 VEVAY
## 13355 DALEVILLE
## 13360 DELPHI
## 13386 WHITESTOWN
## 13389 LOGANSPORT
## 13394 KEMPTON
## 13396 PALMYRA
## 13399 SHELBYVILLE
## 13426 GASTON
## 13451 WINAMAC
## 13472 MAUCKPORT
## 13477 WARSAW
## 13480 ANGOLA
## 13489 NOBLESVILLE
## 13534 NEW MARKET
## 13542 MUNSTER
## 13550 OOLITIC
## 13552 WHITING
## 13557 PENDLETON
## 13580 LA PAZ
## 13608 LAGRANGE
## 13613 ROSELAWN
## 13640 PIERCETON
## 13654 HANOVER
## 13659 MOUNT CARMEL
## 13674 ETNA GREEN
## 13675 SCOTTSBURG
## 13678 CHESTERTON
## 13704 SPEEDWAY
## 13711 WATERLOO
## 13738 PONETO
## 13756 CORUNNA
## 13794 ALEXANDRIA
## 13805 CORNING
## 13806 SIOUX CITY
## 13808 DAVENPORT
## 13820 CHARITON
## 13823 DES MOINES
## 13829 KEOKUK
## 13838 SPENCER
## 13845 MARSHALLTOWN
## 13849 COUNCIL BLUFFS
## 13870 RUSSELL
## 13883 DUBUQUE
## 13884 OSKALOOSA
## 13890 CEDAR RAPIDS
## 13895 SABULA
## 13899 MAQUOKETA
## 13901 ANAMOSA
## 13913 BOONE
## 13925 CEDAR FALLS
## 13931 ANKENY
## 13932 OTTUMWA
## 13939 FORT DODGE
## 13948 LA PORTE CITY
## 13953 EDDYVILLE
## 13962 IOWA CITY
## 13963 MCCLELLAND
## 13965 GILMORE CITY
## 13967 FORT MADISON
## 13968 CLARION
## 13976 LE CLAIRE
## 13985 DENISON
## 14022 ROBINS
## 14024 WEST DES MOINES
## 14038 PANORAMA PARK
## 14045 PRIMGHAR
## 14051 MUSCATINE
## 14056 LE MARS
## 14067 FORT ATKINSON
## 14103 OVERLAND PARK
## 14107 SALINA
## 14109 KANSAS CITY
## 14114 WICHITA
## 14117 TOPEKA
## 14120 CLAY CENTER
## 14121 DODGE CITY
## 14124 LIBERAL
## 14125 WALLACE
## 14126 PAOLA
## 14150 GARDEN CITY
## 14154 COFFEYVILLE
## 14157 GRAINFIELD
## 14163 MANHATTAN
## 14171 PARSONS
## 14176 MINNEAPOLIS
## 14184 HUTCHINSON
## 14188 LEBO
## 14196 LEAVENWORTH
## 14212 ATCHISON
## 14227 SEDAN
## 14228 HAVEN
## 14232 WEBBER
## 14238 FORT SCOTT
## 14241 SCOTT CITY
## 14245 HAYS
## 14246 ABILENE
## 14248 PRATT
## 14269 GARDNER
## 14270 ULYSSES
## 14272 LENEXA
## 14275 REPUBLIC
## 14296 SOLDIER
## 14298 CIMARRON
## 14305 BIRD CITY
## 14312 MISSION
## 14313 OSBORNE
## 14314 HERINGTON
## 14320 ELK CITY
## 14321 TOWNSHIP OF CENTER
## 14327 JOHNSON
## 14334 BASEHOR
## 14350 TONGANOXIE
## 14353 ANDOVER
## 14358 BONNER SPRINGS
## 14362 HOLTON
## 14372 COUNCIL GROVE
## 14379 MERRIAM
## 14395 JUNCTION CITY
## 14399 TYRO
## 14409 HUGOTON
## 14415 BALDWIN CITY
## 14428 MISSION HILLS
## 14429 CHERRYVALE
## 14443 GREAT BEND
## 14446 SILVER LAKE
## 14484 BOWLING GREEN
## 14485 MUNFORDVILLE
## 14497 GARRETT
## 14499 INDEPENDENCE
## 14500 PRESTONSBURG
## 14506 SHELBY GAP
## 14513 CARLISLE
## 14520 LEXINGTON-FAYETTE
## 14532 OWENSBORO
## 14534 WALLINS CREEK
## 14546 MAYSVILLE
## 14547 PAINTSVILLE
## 14554 EVARTS
## 14558 BARDSTOWN
## 14559 PADUCAH
## 14566 FIREBRICK
## 14567 GILBERTSVILLE
## 14568 LOYALL
## 14569 PINEVILLE
## 14570 WILMORE
## 14577 WILLIAMSBURG
## 14584 ELKHORN CITY
## 14585 FRENCHBURG
## 14594 DRY RIDGE
## 14595 PARIS
## 14599 WHITLEY CITY
## 14600 MILLERSBURG
## 14603 MCDANIELS
## 14610 COLD SPRING
## 14612 BEREA
## 14622 BONNYMAN
## 14634 SHELBIANA
## 14637 GRAYSON
## 14638 RINEYVILLE
## 14642 SHIVELY
## 14644 PIPPA PASSES
## 14648 MCCARR
## 14652 VERSAILLES
## 14658 NICHOLASVILLE
## 14672 CORINTH
## 14678 TURKEY CREEK
## 14680 OAK GROVE
## 14689 MULDRAUGH
## 14699 BEVINSVILLE
## 14708 HAZARD
## 14716 GRAHN
## 14737 HICKORY
## 14740 HOPKINSVILLE
## 14752 ASHLAND
## 14758 SHEPHERDSVILLE
## 14762 CRAB ORCHARD
## 14765 REDBUSH
## 14767 HORSE CAVE
## 14785 ELIZABETHTOWN
## 14804 SOMERSET
## 14817 WILDER
## 14832 FALMOUTH
## 14835 WARFIELD
## 14836 CORBIN
## 14856 WALTON
## 14859 NORTONVILLE
## 14860 RAYWICK
## 14865 GUTHRIE
## 14874 SIDNEY
## 14877 HARRODSBURG
## 14882 RADCLIFF
## 14885 META
## 14894 RUSSELL SPRINGS
## 14901 HAPPY
## 14915 PIKEVILLE
## 14922 BLEDSOE
## 14928 MAYKING
## 14935 CATLETTSBURG
## 14945 VERONA
## 14952 BENHAM
## 14956 VINE GROVE
## 14964 CAMPBELLSVILLE
## 14971 OLIVE HILL
## 14974 HIGHLAND HEIGHTS
## 14991 WHITESBURG
## 14995 STANVILLE
## 14997 PINSONFORK
## 15005 BARBOURVILLE
## 15007 GREENUP
## 15010 KENVIR
## 15011 GLENS FORK
## 15019 CAMPTON
## 15049 CRESTVIEW HILLS
## 15054 ARY
## 15089 ROYALTON
## 15091 FORT MITCHELL
## 15099 NEON
## 15102 EASTERN
## 15103 PETERSBURG
## 15116 MALLIE
## 15118 CUMBERLAND
## 15123 NORTH CORBIN
## 15126 HYDEN
## 15129 PEWEE VALLEY
## 15133 KENTON
## 15138 BRANDENBURG
## 15139 PUTNEY
## 15141 CAMPBELLSBURG
## 15183 SILERVILLE
## 15192 HICKMAN
## 15193 SHREVEPORT
## 15198 LAKE CHARLES
## 15205 GROSSE TETE
## 15209 BATON ROUGE
## 15210 GRAMBLING
## 15211 DERIDDER
## 15213 WINNSBORO
## 15219 DONALDSONVILLE
## 15220 MANSURA
## 15228 NATCHITOCHES
## 15229 KENNER
## 15233 HAYNESVILLE
## 15246 BREAUX BRIDGE
## 15254 PAINCOURTVILLE
## 15277 BOSSIER CITY
## 15278 ABBEVILLE
## 15282 COUSHATTA
## 15291 LEESVILLE
## 15292 OPELOUSAS
## 15299 BLANCHARD
## 15301 NEW ORLEANS
## 15302 BROUSSARD
## 15323 KENTWOOD
## 15340 SLIDELL
## 15357 RAYNE
## 15374 HOUMA
## 15380 PLAQUEMINE
## 15386 BASTROP
## 15409 DOYLINE
## 15418 SULPHUR
## 15441 MANDEVILLE
## 15443 BAKER
## 15447 LUTCHER
## 15449 SAINT FRANCISVILLE
## 15471 WINNFIELD
## 15485 LIVONIA
## 15487 GRAND ISLE
## 15493 MINDEN
## 15518 RAYVILLE
## 15547 SAINT AMANT
## 15558 BERWICK
## 15588 RIVER RIDGE
## 15589 AMITE
## 15599 MARKSVILLE
## 15617 NEW IBERIA
## 15637 SORRENTO
## 15650 GRAY
## 15653 GRETNA
## 15658 CARENCRO
## 15660 ZACHARY
## 15666 WEST MONROE
## 15668 RICHWOOD
## 15669 BOGALUSA
## 15691 ROSEPINE
## 15695 PLAIN DEALING
## 15714 DEQUINCY
## 15727 CROWLEY
## 15734 FARMERVILLE
## 15740 TERRYTOWN
## 15741 LORANGER
## 15799 THIBODAUX
## 15804 PORT ALLEN
## 15815 DENHAM SPRINGS
## 15820 ADDIS
## 15860 WELSH
## 15869 JONESVILLE
## 15885 GARYVILLE
## 15886 BELLE ROSE
## 15909 WESTWEGO
## 15919 PRAIRIEVILLE
## 15924 LAPLACE
## 15925 COLFAX
## 15939 ROSEDALE
## 15945 SICILY ISLAND
## 15954 LULING
## 15955 BANGOR
## 15956 ORRINGTON
## 15957 BROWNFIELD
## 15958 ORLAND
## 15961 CANAAN
## 15963 COLUMBIA FALLS
## 15965 PEMBROKE
## 15966 WELLS
## 15967 WAYNE
## 15969 BLUE HILL
## 15971 RANDOLPH
## 15972 PARSONSFIELD
## 15975 LEVANT
## 15976 WINDHAM CENTER
## 15977 ELLSWORTH
## 15980 SULLIVAN
## 15981 HAMPDEN
## 15982 SCARBOROUGH
## 15985 CUMBERLAND CENTER
## 15986 SKOWHEGAN
## 15988 HUDSON
## 15989 TURNER
## 15992 BREWER
## 15993 DENMARK
## 15994 BETHEL
## 15995 BELFAST
## 15997 OLD ORCHARD BEACH
## 16000 ACTON
## 16002 RUMFORD
## 16003 WELD
## 16005 LIMINGTON
## 16006 CORNISH
## 16007 WESLEY
## 16008 STETSON
## 16009 GREENE
## 16010 BUCKSPORT
## 16012 NEW LIMERICK
## 16016 WISCASSET
## 16017 CARIBOU
## 16022 YORK VILLAGE
## 16025 DEDHAM
## 16028 ISLAND FALLS
## 16030 NEW GLOUCESTER
## 16033 GARDINER
## 16035 DAMARISCOTTA
## 16036 KENDUSKEAG
## 16037 SABATTUS
## 16043 SOMESVILLE
## 16049 TOWN OF MACHIASPORT
## 16050 SEBAGO CENTER
## 16051 LYMAN
## 16052 FREEDOM
## 16053 KENNEBUNKPORT
## 16055 HOLLIS CENTER
## 16056 BAR HARBOR
## 16059 FORT KENT
## 16060 WARREN
## 16061 ORIENT
## 16064 CORINNA
## 16069 WINTERPORT
## 16071 SWANVILLE
## 16073 CRAWFORD
## 16074 NORRIDGEWOCK
## 16077 WATERVILLE
## 16079 ALNA
## 16080 BUXTON
## 16083 KENNEBUNK
## 16084 JAY
## 16087 MEXICO
## 16090 SACO
## 16091 WALES CORNER
## 16094 FAYETTE
## 16096 MADAWASKA
## 16097 GORHAM
## 16098 TOPSHAM
## 16166 GRANTSVILLE
## 16173 BALTIMORE
## 16253 OCEAN CITY
## 16377 HAGERSTOWN
## 16415 SALISBURY
## 16419 SNOW HILL
## 16470 BERWYN HEIGHTS
## 16500 BELTSVILLE
## 16528 GLEN BURNIE
## 16534 HYATTSVILLE
## 16538 LANGLEY PARK
## 16539 ARBUTUS
## 16542 NORTH POTOMAC
## 16547 NORTH BETHESDA
## 16548 GREENBELT
## 16549 CHEVERLY
## 16556 CALIFORNIA
## 16557 WALDORF
## 16576 DUNDALK
## 16591 LAUREL ACRES
## 16599 BLADENSBURG
## 16608 SUITLAND
## 16624 CAMP SPRINGS
## 16637 POTOMAC
## 16638 RIVERDALE PARK
## 16640 CAPITOL HEIGHTS
## 16641 BEL AIR
## 16647 METHUEN
## 16649 MEDWAY
## 16650 LEOMINSTER
## 16651 FALL RIVER
## 16652 BROCKTON
## 16655 TOWN OF REHOBOTH
## 16656 ROCKLAND
## 16659 BOURNE
## 16660 WAKEFIELD
## 16661 WAREHAM
## 16662 BOSTON
## 16663 RUSSELLS MILLS
## 16664 MANSFIELD
## 16666 DANVERS
## 16667 WESTFIELD
## 16668 BELLINGHAM
## 16669 BOYLSTON
## 16671 NEW BEDFORD
## 16672 BELMONT
## 16673 MELROSE HIGHLANDS
## 16674 NORTH ANDOVER CENTER
## 16675 WESTBOROUGH
## 16676 DENNIS
## 16678 CHELMSFORD
## 16680 SOUTHWICK
## 16683 WEST SPRINGFIELD
## 16684 YARMOUTH
## 16686 WEYMOUTH
## 16687 MARLBOROUGH
## 16690 TOWN OF EASTON
## 16691 NORTH READING
## 16693 WALES
## 16695 WALTHAM
## 16697 IPSWICH
## 16699 BERKLEY
## 16704 BROOKLINE VILLAGE
## 16708 KINGSTON
## 16710 NORTHAMPTON
## 16717 MILLIS
## 16719 LEVERETT
## 16721 WELLESLEY
## 16722 TOWNSEND
## 16728 MALDEN
## 16730 DRACUT
## 16733 LAKEVILLE
## 16738 ARLINGTON
## 16740 HAVERHILL
## 16741 EAST BILLERICA
## 16744 CHICOPEE
## 16745 MILLBURY
## 16746 WEST DENNIS
## 16749 NORTH ATTLEBORO
## 16750 AMHERST
## 16753 LYNN
## 16754 WESTFORD
## 16755 SOUTH DENNIS
## 16758 TOWN OF DIGHTON
## 16763 RAYNHAM CENTER
## 16765 CHARLTON DEPOT
## 16768 WORCESTER
## 16772 GREAT BARRINGTON
## 16774 FITCHBURG
## 16777 GRANVILLE CENTER
## 16778 WILBRAHAM
## 16783 NORTH ADAMS
## 16798 WRENTHAM
## 16802 NORTH DARTMOUTH
## 16803 MEDFORD
## 16809 CHELSEA
## 16813 HOPKINTON
## 16820 WEBSTER
## 16827 NANTUCKET
## 16831 FAIRHAVEN
## 16839 STOUGHTON
## 16851 SHREWSBURY
## 16853 HEAD OF WESTPORT
## 16854 MIDDLEBORO
## 16858 NEWBURYPORT
## 16859 GROVELAND
## 16863 GREENFIELD
## 16864 WILLIAMSTOWN
## 16865 BECKET
## 16867 REHOBOTH
## 16870 FREETOWN
## 16872 GLOUCESTER
## 16873 HOLYOKE
## 16875 HARVARD STATION
## 16877 WESTHAMPTON
## 16883 LANESBOROUGH
## 16885 SOUTH HADLEY
## 16887 STURBRIDGE
## 16895 WARE
## 16907 BRADFORD
## 16910 TYNGSBORO
## 16912 MASHPEE
## 16915 ABINGTON
## 16917 HOLDEN CENTER
## 16921 BRIDGEWATER
## 16923 SCITUATE
## 16925 NEWBURY OLD TOWN
## 16929 VINEYARD HAVEN
## 16931 SHERBORN
## 16937 HOLLISTON
## 16938 SAUGUS
## 16944 TOWN OF UXBRIDGE
## 16950 SOMERVILLE
## 16951 HYANNIS
## 16955 SOUTH BYFIELD
## 16960 DEERFIELD
## 16965 WEST NEWBURY
## 16966 UXBRIDGE
## 16968 BOXFORD
## 16970 NAHANT
## 16971 LEICESTER
## 16974 DETROIT
## 16975 PONTIAC
## 16976 WYOMING
## 16978 SUMNER
## 16981 GRAND RAPIDS
## 16984 EASTPOINTE
## 16986 CEDAR SPRINGS
## 16990 PAW PAW
## 16992 CLINTON TOWNSHIP
## 17001 WAUCEDAH
## 17002 POWERS
## 17003 MIDLAND
## 17005 EAST CHINA TOWNSHIP
## 17008 ROMULUS
## 17011 FLINT
## 17025 PERRY
## 17028 WESTLAND
## 17030 MELVIN
## 17042 ALPINE
## 17043 MIKADO
## 17045 NOTTAWA
## 17052 BURTON
## 17053 CARO
## 17055 REDFORD TOWNSHIP
## 17056 SAINT CLAIR SHORES
## 17059 HOLLY
## 17072 SHELBY
## 17086 NORVELL
## 17087 SOUTHGATE
## 17091 TRAVERSE CITY
## 17092 ROYAL OAK
## 17099 IRON RIVER
## 17101 SOUTHFIELD
## 17108 RUDYARD
## 17110 FLINT TOWNSHIP
## 17111 HARTLAND
## 17116 DAFTER
## 17134 ANN ARBOR
## 17135 FARMINGTON HILLS
## 17142 STERLING HEIGHTS
## 17144 TALLMADGE
## 17148 KALAMAZOO
## 17156 BROWNSTOWN TOWNSHIP
## 17168 EATON RAPIDS
## 17172 GRANDVILLE
## 17180 ALPENA
## 17181 MENOMINEE
## 17187 PLEASANT RIDGE
## 17188 DELTA MILLS
## 17202 HOLLAND
## 17219 MUSKEGON HEIGHTS
## 17226 THREE RIVERS
## 17228 MOUNT MORRIS
## 17256 MUSKEGON
## 17259 MADISON HEIGHTS
## 17268 COVERT
## 17274 CHARLOTTE
## 17275 PORT HURON
## 17290 WYANDOTTE
## 17305 BATTLE CREEK
## 17326 LINCOLN PARK
## 17347 COMSTOCK
## 17354 ALAMO
## 17361 BLOOMFIELD VILLAGE
## 17382 CANTON TOWNSHIP
## 17391 ERIE
## 17401 RIGA
## 17406 CARP LAKE
## 17420 EAST GRAND RAPIDS
## 17421 FILER CITY
## 17439 INKSTER
## 17448 BARAGA
## 17450 IMLAY CITY
## 17459 ALLEN PARK
## 17474 WHITE LAKE
## 17475 GILFORD
## 17481 DEARBORN
## 17535 TAYLOR
## 17567 EAST TAWAS
## 17574 MACOMB, TOWNSHIP
## 17587 BANGOR TOWNSHIP
## 17590 OMER
## 17608 HIGHLAND PARK
## 17612 NORTHFIELD TOWNSHIP
## 17634 KIMBALL
## 17642 EVART
## 17646 RAY TOWNSHIP
## 17655 WIXOM
## 17657 HADLEY
## 17681 HASTINGS
## 17687 SAGOLA
## 17707 FRASER
## 17709 RICHLAND
## 17717 ROCKWOOD
## 17724 OSHTEMO
## 17725 BIRCH RUN
## 17727 BIG RAPIDS
## 17737 YPSILANTI
## 17738 PECK
## 17739 DEARBORN HEIGHTS
## 17753 BENTON HEIGHTS
## 17761 PLAINWELL
## 17767 FORD RIVER
## 17770 CENTER LINE
## 17785 CHARLEVOIX
## 17790 ROCHESTER
## 17818 CHESTERFIELD TOWNSHIP
## 17838 NORTON SHORES
## 17846 NEW BALTIMORE
## 17855 NOVI
## 17856 ADRIAN
## 17859 FILLMORE
## 17863 OVID
## 17870 SAGINAW
## 17875 PARMA
## 17885 GROSSE POINTE FARMS
## 17893 CADILLAC
## 17898 ECORSE
## 17907 HAMTRAMCK
## 17930 MOUNT CLEMENS
## 17938 IRON MOUNTAIN
## 17958 CHEBOYGAN
## 17962 BENTON HARBOR
## 17973 MANISTEE
## 17974 VAN BOWEN
## 17984 MABEL
## 17986 INVER GROVE HEIGHTS
## 17988 GAYLORD
## 17991 SHAKOPEE
## 17994 OTSEGO
## 17999 ROSEMOUNT
## 18001 MOORHEAD
## 18020 EAGAN
## 18021 BROOKLYN PARK
## 18023 MAPLEWOOD
## 18026 SAINT PAUL
## 18027 BURNSVILLE
## 18029 BEMIDJI
## 18030 BLAINE
## 18044 EVELETH
## 18047 HOPKINS
## 18056 MINNETONKA MILLS
## 18062 DULUTH
## 18074 BROOKLYN CENTER
## 18086 CLEAR LAKE
## 18088 HAM LAKE
## 18097 VICTORIA
## 18100 RICHFIELD
## 18108 ELK RIVER
## 18111 HIBBING
## 18120 EAST BETHEL
## 18122 MENDOTA HEIGHTS
## 18126 CHISHOLM
## 18127 MOUNDS VIEW
## 18133 RAMSEY
## 18139 EAGLE LAKE
## 18147 PROCTOR
## 18148 SAINT PETER
## 18160 FOREST LAKE
## 18162 CORCORAN
## 18164 MORA
## 18177 AFTON
## 18182 LINO LAKES
## 18193 COON RAPIDS
## 18201 FAIRMONT
## 18209 COLUMBIA HEIGHTS
## 18211 OWATONNA
## 18224 EDEN PRAIRIE
## 18241 SAINT FRANCIS
## 18249 SAINT LOUIS PARK
## 18251 SAVAGE
## 18254 TROMMALD
## 18256 FERGUS FALLS
## 18260 ISANTI
## 18261 ZIMMERMAN
## 18265 ORONO
## 18268 COLERAINE
## 18272 FARIBAULT
## 18274 BRAINERD
## 18279 LAKE ELMO
## 18284 LINDSTROM
## 18297 CLOQUET
## 18314 STANCHFIELD
## 18319 LITTLE FALLS
## 18320 WAITE PARK
## 18334 WORTHINGTON
## 18343 CANNON FALLS
## 18348 BAGLEY
## 18350 BLUE EARTH
## 18357 HATTIESBURG
## 18359 BOONEVILLE
## 18360 RAYMOND
## 18361 TUPELO
## 18373 GULFPORT
## 18374 PICAYUNE
## 18386 PEARL
## 18410 RIDGELAND
## 18411 CALHOUN CITY
## 18412 GRENADA
## 18418 MOSS POINT
## 18439 CLARKSDALE
## 18440 BILOXI
## 18450 MORTON
## 18467 VARDAMAN
## 18469 WINONA
## 18484 PASCAGOULA
## 18490 MENDENHALL
## 18513 BROOKHAVEN
## 18549 MCCOMB
## 18554 NATCHEZ
## 18577 OLIVE BRANCH
## 18600 LUCEDALE
## 18613 SOUTHAVEN
## 18628 WATER VALLEY
## 18639 PASS CHRISTIAN
## 18695 CARTHAGE
## 18717 ABERDEEN
## 18748 HERNANDO
## 18752 SHANNON
## 18770 YAZOO CITY
## 18799 TERRY
## 18800 GLOSTER
## 18804 DURANT
## 18812 WIGGINS
## 18821 BAY SPRINGS
## 18822 LEARNED
## 18831 STARKVILLE
## 18834 MOUND BAYOU
## 18841 BRANDON
## 18869 INDIANOLA
## 18878 WESSON
## 18890 SENATOBIA
## 18900 SUMMIT
## 18901 MAGEE
## 18966 D'IBERVILLE
## 19008 LELAND
## 19009 UTICA
## 19014 WOODVILLE
## 19019 LEXINGTON
## 19020 TCHULA
## 19040 SAINT LOUIS
## 19041 SAINT JOHNS
## 19042 GLADSTONE
## 19043 WENTZVILLE
## 19045 GRANDVIEW
## 19051 FORDLAND
## 19055 ELSBERRY
## 19070 WEST PLAINS
## 19078 HIGHLANDVILLE
## 19091 IRONTON
## 19093 EXCELSIOR SPRINGS
## 19097 WARRENSBURG
## 19098 PECULIAR
## 19102 LEES SUMMIT
## 19115 FERGUSON
## 19116 LAKE SAINT LOUIS
## 19122 KIRKSVILLE
## 19134 FENTON
## 19135 CAPE GIRARDEAU
## 19136 SIKESTON
## 19141 PURDY
## 19146 CREVE COEUR
## 19148 SEDALIA
## 19149 WESTPHALIA
## 19150 ARNOLD
## 19155 KENNETT
## 19163 SAINT JOSEPH
## 19165 BLUE SPRINGS
## 19168 JOPLIN
## 19172 JEFFERSON CITY
## 19177 SAINT PETERS
## 19180 MARYLAND HEIGHTS
## 19182 HARRISONVILLE
## 19214 CARUTHERSVILLE
## 19232 WRIGHT CITY
## 19236 UNIVERSITY CITY
## 19241 SAINT CLAIR
## 19257 FARMINGTON
## 19267 KIRKWOOD
## 19274 VINITA PARK
## 19278 JENNINGS
## 19279 LADUE
## 19284 DELLWOOD
## 19290 SUNSET HILLS
## 19293 SAINT MARTINS
## 19295 FLORISSANT
## 19296 MONETT
## 19299 RAYTOWN
## 19300 MOLINE ACRES
## 19314 LINN CREEK
## 19317 NEOSHO
## 19330 HAZELWOOD
## 19367 PLATTE CITY
## 19368 BELLEFONTAINE NEIGHBORS
## 19370 BOONVILLE
## 19390 BRIDGETON
## 19392 PACIFIC
## 19408 MARSHFIELD
## 19417 TOWN AND COUNTRY
## 19428 PINE LAWN
## 19466 POPLAR BLUFF
## 19472 MOBERLY
## 19488 ORONOGO
## 19521 PEVELY
## 19534 OVERLAND
## 19544 LONE JACK
## 19565 NEW MELLE
## 19578 HAYTI
## 19581 RICHMOND HEIGHTS
## 19591 LAKE TAPAWINGO
## 19604 SAINT ROBERT
## 19606 MONROE CITY
## 19624 JONESBURG
## 19668 HALLTOWN
## 19684 BELTON
## 19692 CHESTERFIELD
## 19700 HANNIBAL
## 19716 NIXA
## 19726 COOL VALLEY
## 19742 MOSCOW MILLS
## 19767 BALLWIN
## 19773 THAYER
## 19782 KIMMSWICK
## 19784 JANE
## 19885 COTTLEVILLE
## 19916 FORISTELL
## 19945 WELDON SPRING
## 19965 MISSOULA
## 19973 BILLINGS
## 20030 GREAT FALLS
## 20089 BELGRADE
## 20093 KALISPELL
## 20097 BUTTE
## 20146 BEATRICE
## 20152 OMAHA
## 20201 BELLEVUE
## 20203 FRIEND
## 20210 SUTTON
## 20224 KEARNEY
## 20270 YORK
## 20275 NORTH PLATTE
## 20292 SPALDING
## 20305 WAHOO
## 20308 O'NEILL
## 20328 SCOTTSBLUFF
## 20349 BLAIR
## 20361 LAS VEGAS
## 20369 NORTH LAS VEGAS
## 20370 RENO
## 20373 HENDERSON
## 20425 FALLON
## 20550 CARSON CITY
## 20657 NEW IPSWICH
## 20659 BROOKLINE
## 20661 MERRIMACK
## 20664 STRAFFORD
## 20665 HOOKSETT
## 20666 NEW LONDON
## 20667 CANDIA
## 20669 PORTSMOUTH
## 20671 NASHUA
## 20672 DERRY VILLAGE
## 20681 LEE
## 20683 TWIN MOUNTAIN
## 20685 CHICHESTER
## 20687 WALPOLE
## 20688 WARNER
## 20693 FITZWILLIAM
## 20697 WENTWORTH
## 20702 LONDONDERRY
## 20703 SOUTH HAMPTON
## 20704 GREENLAND STATION
## 20705 LACONIA
## 20717 SANBORNTON
## 20718 BOSCAWEN
## 20719 HENNIKER
## 20724 NORTH HAMPTON
## 20728 JAFFREY CENTER
## 20733 WILMOT FLAT
## 20735 OSSIPEE
## 20737 HAMPTON FALLS
## 20741 CHESTER
## 20742 EPSOM
## 20744 SEABROOK
## 20745 MASON
## 20747 TILTON
## 20749 RINDGE
## 20753 EGG HARBOR CITY
## 20754 MOUNT OLIVE
## 20755 HOLMDEL
## 20756 SECAUCUS
## 20757 VINELAND
## 20758 WANTAGE
## 20759 WATERFORD WORKS
## 20761 PATERSON
## 20764 TOMS RIVER
## 20768 GARWOOD
## 20770 TOWNSHIP OF WARREN
## 20771 PENNS GROVE
## 20773 EAST ORANGE
## 20775 MOUNTAINSIDE
## 20776 FAIRVIEW
## 20777 PENNSVILLE
## 20779 FORT LEE
## 20786 MILLVILLE
## 20787 HASBROUCK HEIGHTS
## 20791 TOWNSHIP OF PITTSGROVE
## 20792 BELLMAWR
## 20793 CHERRY HILL
## 20795 WEST DEPTFORD
## 20796 TOWNSHIP OF BRIDGEWATER
## 20797 PENNSAUKEN
## 20803 MANCHESTER TOWNSHIP
## 20804 JERSEY CITY
## 20805 PLEASANTVILLE
## 20806 CLIFTON
## 20810 WALDWICK
## 20811 DEPTFORD
## 20813 GALLOWAY TOWNSHIP
## 20818 NEPTUNE CITY
## 20819 TOWNSHIP OF BRICK
## 20820 FRANKLINVILLE
## 20824 GLOUCESTER CITY
## 20825 NORTH BERGEN
## 20828 HAMILTON
## 20831 WASHINGTON TOWNSHIP
## 20834 NEW BRUNSWICK
## 20837 PISCATAWAY
## 20838 EDISON
## 20839 PERTH AMBOY
## 20840 MONTVALE
## 20842 MOUNT LAUREL
## 20843 TOWNSHIP OF SOUTH ORANGE VILLAGE
## 20845 HACKENSACK
## 20848 HAMMONTON
## 20851 OLD BRIDGE
## 20853 WEST MILFORD
## 20855 PLAINSBORO
## 20856 METUCHEN
## 20860 CRANFORD
## 20862 WESTAMPTON TOWNSHIP
## 20872 FAIR LAWN
## 20875 BRANCHBURG PARK
## 20878 RIVER EDGE
## 20879 EATONTOWN
## 20880 ROSELAND
## 20886 WATCHUNG
## 20887 EGG HARBOR TOWNSHIP
## 20889 TOWNSHIP OF EWING
## 20894 FRANKLIN PARK
## 20896 NORTH PLAINFIELD
## 20899 FREEHOLD
## 20906 WALL TOWNSHIP
## 20913 MONROE TOWNSHIP
## 20916 SAYREVILLE
## 20920 RUTHERFORD
## 20922 LUMBERTON
## 20924 MOORESTOWN
## 20927 SOUTH BRUNSWICK
## 20928 CINNAMINSON
## 20929 LOGAN
## 20930 WEEHAWKEN
## 20936 NORTH BRUNSWICK
## 20938 CRANBURY
## 20942 CARNEYS POINT
## 20954 MAURICETOWN
## 20960 BAYONNE
## 20964 RUNNEMEDE
## 20965 BROOKLAWN
## 20971 MARLBORO
## 20978 HAMILTON TOWNSHIP
## 20983 LINWOOD
## 20985 TEANECK
## 20987 EAST RUTHERFORD
## 20988 RED BANK
## 20994 ATLANTIC CITY
## 20995 SOMERS POINT
## 21000 TOWNSHIP OF SOUTHAMPTON
## 21016 PARAMUS
## 21028 ROBBINSVILLE
## 21034 EAST BRUNSWICK
## 21035 BURLINGTON TOWNSHIP
## 21037 WEST WINDSOR
## 21039 BRIGANTINE
## 21050 TOWNSHIP OF IRVINGTON
## 21052 TINTON FALLS
## 21059 CLARK
## 21085 READINGTON
## 21087 MONTVILLE
## 21091 MILLTOWN
## 21099 COLLINGSWOOD
## 21104 BOUND BROOK
## 21110 WILLINGBORO
## 21112 LINDEN
## 21114 EAST WINDSOR
## 21115 BLOOMINGDALE
## 21118 PARSIPPANY
## 21119 WANAQUE
## 21122 HAZLET
## 21127 PORT REPUBLIC
## 21131 MAPLE SHADE
## 21135 WHARTON
## 21142 TABERNACLE
## 21151 NUTLEY
## 21154 MINE HILL
## 21165 HALEDON
## 21167 HOWELL
## 21172 MOUNT HOLLY
## 21193 PASSAIC
## 21196 VOORHEES
## 21198 PEMBERTON
## 21203 BEDMINSTER
## 21207 NEW PROVIDENCE
## 21211 WOOD-RIDGE
## 21212 MOUNTAIN LAKES
## 21232 SOUTH PLAINFIELD
## 21234 HARMONY
## 21251 HADDON HEIGHTS
## 21262 DENVILLE
## 21263 WEST NEW YORK
## 21267 ROSELLE PARK
## 21270 KENILWORTH
## 21279 MANTUA
## 21289 CRESSKILL
## 21299 SANTA FE
## 21301 ALBUQUERQUE
## 21305 SAN FIDEL
## 21306 ESPA\xd1OLA
## 21311 STANLEY
## 21319 GALLUP
## 21320 SAN FELIPE
## 21326 PLACITAS
## 21329 LOVINGTON
## 21339 LAS CRUCES
## 21347 VADO
## 21354 ARTESIA
## 21361 ARROYO SECO
## 21365 EDGEWOOD
## 21374 EUNICE
## 21383 SILVER CITY
## 21385 HOBBS
## 21395 PE\xd1ASCO
## 21402 PERALTA
## 21410 SUNLAND PARK
## 21413 FENCE LAKE
## 21414 PILAR
## 21415 MEXICAN SPRINGS
## 21417 LOS LUNAS
## 21420 ANTHONY
## 21424 SANDIA PARK
## 21429 SANTA ANA PUEBLO
## 21432 DULCE
## 21435 CLOUDCROFT
## 21439 SOCORRO
## 21443 RIO RANCHO
## 21446 RED RIVER
## 21447 DEMING
## 21450 CROWNPOINT
## 21455 EL PRADO
## 21456 LAGUNA
## 21457 MILAN
## 21462 RANCHOS DE TAOS
## 21465 CHURCH ROCK
## 21470 NEWCOMB
## 21477 RINCONADA
## 21483 DURAN
## 21488 FRUITLAND
## 21490 CLIFF
## 21491 BELEN
## 21521 ABIQUIU
## 21526 TRUTH OR CONSEQUENCES
## 21527 SHIPROCK
## 21528 ZIA PUEBLO
## 21531 EMBUDO
## 21535 MORIARTY
## 21548 YAH-TA-HEY
## 21555 AMALIA
## 21558 BERINO
## 21562 JEMEZ SPRINGS
## 21573 QUEMADO
## 21577 MEDANALES
## 21582 BERNALILLO
## 21584 LOS ALAMOS
## 21588 SEAMA
## 21589 PORTALES
## 21590 TAOS
## 21596 TRES PIEDRAS
## 21609 KIRTLAND
## 21610 JAL
## 21620 ALAMOGORDO
## 21622 COCHITI PUEBLO
## 21659 TALPA
## 21662 TULAROSA
## 21666 NEW YORK CITY
## 21667 PITTSFORD
## 21668 ISLIP
## 21669 GREECE
## 21670 HALFMOON
## 21672 SOUTHAMPTON
## 21674 IRONDEQUOIT
## 21676 FORT COVINGTON
## 21677 HUNTINGTON
## 21678 KEESEVILLE
## 21679 SOUTHOLD
## 21682 MIDDLE VILLAGE
## 21683 TARRYTOWN
## 21685 EVANS MILLS
## 21686 MILLBROOK
## 21687 NEW CITY
## 21690 HEMPSTEAD
## 21695 ALEXANDER
## 21696 SLOATSBURG
## 21697 CLARKSON
## 21701 SINCLAIRVILLE
## 21702 HARRISVILLE
## 21705 ERIN
## 21707 BABYLON
## 21708 SPENCERPORT
## 21711 GALWAY
## 21713 NORTH TONAWANDA
## 21714 SMITHVILLE FLATS
## 21720 SCHAGHTICOKE
## 21721 ISLANDIA
## 21724 NEW YORK
## 21725 AUSTERLITZ
## 21726 HUDSON FALLS
## 21727 BATAVIA
## 21728 NEW HYDE PARK
## 21732 LIVERPOOL
## 21735 CALLICOON
## 21737 CAMILLUS
## 21739 PLEASANT VALLEY
## 21743 WHITESBORO
## 21744 BIG FLATS
## 21746 MAYFIELD
## 21749 DEPOSIT
## 21750 DELMAR
## 21754 CORNWALL-ON-HUDSON
## 21756 CHEEKTOWAGA
## 21761 CLYMER
## 21762 HYDE PARK
## 21763 TONAWANDA
## 21764 WESTMORELAND
## 21769 FALLSBURG
## 21774 FREDONIA
## 21775 ALLEGANY
## 21776 CASTILE
## 21778 WYNANTSKILL
## 21780 HORSEHEADS
## 21781 OYSTER BAY
## 21783 SENNETT
## 21784 AVOCA
## 21787 SCOTTSVILLE
## 21791 PORT JERVIS
## 21792 CHENANGO BRIDGE
## 21794 NIAGARA
## 21795 ROTTERDAM
## 21796 CLAY
## 21801 SAUGERTIES
## 21803 ARDSLEY
## 21804 BEDFORD
## 21806 SKANEATELES
## 21807 PAINTED POST
## 21809 BATH
## 21811 STONY POINT
## 21812 RICHFIELD SPRINGS
## 21815 WOLCOTT
## 21818 PENN YAN
## 21819 AIRMONT
## 21820 NIAGARA FALLS
## 21824 ONONDAGA HILL
## 21827 CIRCLEVILLE
## 21828 WEST LEYDEN
## 21831 HAMLIN
## 21833 PETERBORO
## 21836 RIVERHEAD
## 21839 BRANT
## 21852 MARBLETOWN
## 21854 JOHNSONVILLE
## 21857 HUNTER
## 21858 CORTLANDT
## 21860 CAMERON
## 21866 POUGHKEEPSIE
## 21868 NEW ROCHELLE
## 21870 HOPEWELL JUNCTION
## 21873 CROTON-ON-HUDSON
## 21874 LAGRANGEVILLE
## 21875 CLARENCE
## 21878 BERGEN
## 21879 ALTMAR
## 21886 HENRIETTA
## 21892 AMENIA
## 21895 WILTON
## 21898 LACKAWANNA
## 21902 ILION
## 21904 MONSEY
## 21907 ANTWERP
## 21909 VERBANK
## 21911 CANANDAIGUA
## 21916 RHINEBECK
## 21937 CENTERVILLE
## 21941 HERKIMER
## 21942 SARANAC LAKE
## 21943 HOLTSVILLE
## 21944 TRUMANSBURG
## 21948 VOLNEY
## 21949 OLD FORGE
## 21955 PATCHOGUE
## 21957 CLAVERACK
## 21958 CUDDEBACKVILLE
## 21959 STAFFORD
## 21960 WAWARSING
## 21961 BUFFALO
## 21966 LAKE GEORGE
## 21977 YONKERS
## 21980 NEWARK VALLEY
## 21982 MARCY
## 21985 WINTHROP
## 21986 LLOYD
## 21993 CONSTANTIA
## 22007 COLONIE
## 22010 RAMAPO
## 22012 CORTLAND
## 22015 ITHACA
## 22016 RICHFORD
## 22017 STEPHENTOWN
## 22020 EAST PHARSALIA
## 22025 SCHENECTADY
## 22036 EAST BLOOMFIELD
## 22040 ENDICOTT
## 22042 GATES
## 22044 KNOX
## 22053 ELMIRA
## 22055 REMSEN
## 22061 GLEN COVE
## 22067 ROYALTON CENTER
## 22071 CENTEREACH
## 22076 CENTRAL ISLIP
## 22083 SMITHTOWN
## 22084 RIDGE
## 22092 DUNKIRK
## 22093 LINDENHURST
## 22099 NORTH HILLS
## 22102 CAMBRIDGE
## 22104 JAMESTOWN
## 22116 TUXEDO PARK
## 22117 MOHAWK
## 22123 MIDDLEBURG
## 22125 WAPPINGER
## 22128 EAST HAMPTON
## 22129 FISHKILL
## 22131 MASSAPEQUA PARK
## 22132 DRESDEN
## 22133 CHEMUNG
## 22146 PLATTSBURGH
## 22149 LOWVILLE
## 22157 YORKTOWN HEIGHTS
## 22167 CANASTOTA
## 22168 SANBORN
## 22170 CLYDE
## 22175 LITTLE VALLEY
## 22181 SPRAKERS
## 22183 SOUTH GLENS FALLS
## 22185 DUANESBURG
## 22186 CHARLTON
## 22193 PREBLE
## 22194 OLEAN
## 22195 NEW PALTZ
## 22198 TULLY
## 22199 WAYLAND
## 22200 SLATE HILL
## 22203 SPRING VALLEY
## 22206 HIGHLAND FALLS
## 22207 MC DONOUGH
## 22214 ROSLYN ESTATES
## 22218 VESTAL
## 22219 SUFFERN
## 22224 WILSON
## 22226 EAST ROCHESTER
## 22231 NEW BERLIN
## 22233 SCHROON LAKE
## 22239 CAYUGA
## 22245 SODUS
## 22251 WHITEHALL
## 22252 FORESTBURG
## 22262 CANDOR
## 22271 PRATTSBURG
## 22274 THREE MILE BAY
## 22275 RUSH
## 22283 INTERLAKEN
## 22289 OLIVEBRIDGE
## 22290 WESTTOWN
## 22293 CLIFTON PARK
## 22294 SCARSDALE
## 22297 DELHI
## 22304 ONEIDA
## 22306 PENFIELD
## 22314 BLOOMING GROVE
## 22317 GILBOA
## 22321 DRYDEN
## 22335 AMSTERDAM
## 22339 POUND RIDGE
## 22342 MALTA
## 22349 SARATOGA SPRINGS
## 22350 GASPORT
## 22357 THERESA
## 22361 NISKAYUNA
## 22366 BOMBAY
## 22367 BROADALBIN
## 22370 STANFORDVILLE
## 22371 BUSTI
## 22377 JOHNSTOWN
## 22384 ELMA
## 22385 COLLINS
## 22386 NYACK
## 22387 PARISH
## 22389 CHURCHVILLE
## 22393 CLOCKVILLE
## 22395 MELVILLE
## 22399 WILLISTON PARK
## 22406 BLACK CREEK
## 22407 MIDDLE GROVE
## 22408 JAVA CENTER
## 22414 LAKE GROVE
## 22424 BARTON
## 22429 SHIRLEY
## 22432 POTSDAM
## 22435 EASTPORT
## 22438 RED HOOK
## 22447 OLD WESTBURY
## 22462 MENANDS
## 22463 YORKSHIRE
## 22464 WURTSBORO
## 22467 NEW WINDSOR
## 22470 SOUTH SALEM
## 22496 NORTH COLLINS
## 22509 RENSSELAER
## 22511 ORCHARD PARK
## 22516 SARDINIA
## 22525 PEEKSKILL
## 22530 FINE
## 22532 SWAIN
## 22543 FULTONVILLE
## 22556 MIDDLE ISLAND
## 22564 GREAT NECK
## 22566 STONY BROOK
## 22572 CORAM
## 22574 QUEENSBURY
## 22580 ROSENDALE
## 22583 CROGHAN
## 22584 FLORAL PARK
## 22585 MILLERTON
## 22589 DEFERIET
## 22594 DOWNSVILLE
## 22596 LATHAM
## 22603 BREWSTER
## 22604 LYNBROOK
## 22624 GUILDERLAND
## 22626 BEACON
## 22627 GRAHAM
## 22636 ASHEVILLE
## 22651 WHITEVILLE
## 22652 NEW BERN
## 22669 GASTONIA
## 22673 GREENSBORO
## 22675 HIGH POINT
## 22683 STATESVILLE
## 22696 HUNTERSVILLE
## 22703 RED OAK
## 22715 RED SPRINGS
## 22719 KING
## 22720 MOUNT AIRY
## 22724 KITTRELL
## 22725 RALEIGH
## 22738 POLKTON
## 22761 WINSTON SALEM
## 22773 SUMMERFIELD
## 22777 ANGIER
## 22778 WAYNESVILLE
## 22780 HENDERSONVILLE
## 22796 SOUTHERN PINES
## 22801 CHAPEL HILL
## 22802 BAYBORO
## 22803 ELIZABETH CITY
## 22819 CARY
## 22823 ROLESVILLE
## 22852 KERNERSVILLE
## 22880 KINSTON
## 22886 ROCKY MOUNT
## 22892 ALLIANCE
## 22904 MAXTON
## 22912 INDIAN TRAIL
## 22918 ZEBULON
## 22930 TAR HEEL
## 22943 THOMASVILLE
## 22948 WALKERTOWN
## 22986 CORNELIUS
## 23011 CHINA GROVE
## 23015 WAGRAM
## 23035 LENOIR
## 23070 LILLINGTON
## 23081 MATTHEWS
## 23119 RUTH
## 23151 SHALLOTTE
## 23154 ASHEBORO
## 23160 WINTERVILLE
## 23233 KANNAPOLIS
## 23234 DOBSON
## 23252 SMITHFIELD
## 23263 GARNER
## 23342 CLEMMONS
## 23386 ROANOKE RAPIDS
## 23495 WAKE FOREST
## 23500 MILLERS CREEK
## 23521 KNIGHTDALE
## 23541 CONOVER
## 23646 TRINITY
## 23675 GROVER
## 23684 TARBORO
## 23718 COATS
## 23750 WILSONS MILLS
## 23806 MORGANTON
## 23835 VASS
## 23895 GOLDSBORO
## 23904 ROCKINGHAM
## 23933 MINT HILL
## 23952 HAW RIVER
## 24008 FOREST CITY
## 24009 EDENTON
## 24010 MOREHEAD CITY
## 24014 AYDEN
## 24020 EDEN
## 24023 LANDIS
## 24026 EAST SPENCER
## 24027 FUQUAY-VARINA
## 24037 AHOSKIE
## 24041 BISMARCK
## 24042 GRAND FORKS
## 24043 RAY
## 24047 FARGO
## 24060 MINOT
## 24079 MANDAN
## 24081 WATFORD CITY
## 24092 SENTINEL BUTTE
## 24099 FESSENDEN
## 24102 WILLISTON
## 24132 BELCOURT
## 24133 SAINT MICHAEL
## 24135 TOLEDO
## 24145 WEST MIDDLETOWN
## 24148 CINCINNATI
## 24168 OBETZ
## 24170 HANGING ROCK
## 24171 BARBERTON
## 24195 DAYTON
## 24203 TROTWOOD
## 24212 FAIRBORN
## 24213 MORAINE
## 24215 NORTH OLMSTED
## 24219 LIMA
## 24237 MIAMISBURG
## 24240 NORTH COLLEGE HILL
## 24241 EAST CLEVELAND
## 24248 HUBER HEIGHTS
## 24274 PORTERFIELD
## 24282 WESTERVILLE
## 24288 WEST CARROLLTON
## 24292 TIPP CITY
## 24305 INDIAN HILL
## 24306 COLUMBIANA
## 24332 CUYAHOGA FALLS
## 24339 LORAIN
## 24342 PATASKALA
## 24343 NORTH CANTON
## 24344 NORTH ROYALTON
## 24345 WEST JEFFERSON
## 24351 YOUNGSTOWN
## 24354 WAUSEON
## 24374 NORTON
## 24386 CONNEAUT
## 24400 EUCLID
## 24425 PARMA HEIGHTS
## 24440 BROOK PARK
## 24447 FINDLAY
## 24455 VALLEY VIEW
## 24462 WILLOWICK
## 24465 WILLOUGHBY
## 24470 ASHTABULA
## 24510 SAINT BERNARD
## 24521 SOUTH LEBANON
## 24541 BLOOMINGBURG
## 24546 GAHANNA
## 24558 MOUNT ORAB
## 24568 STRONGSVILLE
## 24588 WESTLAKE
## 24590 GREEN
## 24611 TRIMBLE
## 24617 GIRARD
## 24622 WARRENSVILLE HEIGHTS
## 24640 BLANCHESTER
## 24648 WELLSTON
## 24650 MAUMEE
## 24654 SHARONVILLE
## 24662 EASTLAKE
## 24666 READING
## 24732 XENIA
## 24740 THORNVILLE
## 24760 DELAWARE
## 24764 SANDUSKY
## 24769 BOSTON HEIGHTS
## 24799 MENTOR
## 24837 ADA
## 24851 OLMSTED FALLS
## 24853 RUSHSYLVANIA
## 24862 NEW PHILADELPHIA
## 24877 WASHINGTON COURT HOUSE
## 24879 COAL GROVE
## 24898 PICKERINGTON
## 24903 UHRICHSVILLE
## 24904 OTTAWA HILLS
## 24910 CANAL WINCHESTER
## 24935 WICKLIFFE
## 24962 CELINA
## 24982 MIDDLEBURG HEIGHTS
## 24990 PAULDING
## 24995 POWELL
## 25030 NEW BOSTON
## 25033 MASSILLON
## 25043 ELYRIA
## 25052 BEAVER CREEK
## 25062 BROOKLYN
## 25091 ZANESVILLE
## 25124 EAST PALESTINE
## 25132 BEACHWOOD
## 25176 WINTERSVILLE
## 25234 LYNDHURST
## 25241 KETTERING
## 25254 RAVENNA
## 25290 TULSA
## 25292 EL RENO
## 25293 OKLAHOMA CITY
## 25310 STROUD
## 25318 MOORE
## 25320 DIBBLE
## 25322 PIEDMONT
## 25343 DUNCAN
## 25349 RYAN
## 25371 NORMAN
## 25380 SAPULPA
## 25381 MINCO
## 25383 MUSKOGEE
## 25391 SHAWNEE
## 25404 PURCELL
## 25413 IDABEL
## 25414 NEWCASTLE
## 25415 POTEAU
## 25418 BROKEN ARROW
## 25427 ARDMORE
## 25455 CARTWRIGHT
## 25470 THE VILLAGE
## 25472 DEL CITY
## 25475 CHICKASHA
## 25482 STILLWATER
## 25484 WARR ACRES
## 25485 ENID
## 25487 CARTER
## 25508 GOLDSBY
## 25513 LUTHER
## 25585 CATOOSA
## 25607 STRINGTOWN
## 25640 HOLDENVILLE
## 25641 KELLYVILLE
## 25663 COWETA
## 25664 LAWTON
## 25687 QUINLAN
## 25699 BURNS FLAT
## 25706 CUSHING
## 25719 BYNG
## 25733 OKMULGEE
## 25761 GUYMON
## 25769 OWASSO
## 25771 MARLOW
## 25773 WAUKOMIS
## 25774 YUKON
## 25776 WAURIKA
## 25777 TUTTLE
## 25795 ANADARKO
## 25796 MUSTANG
## 25801 WAGONER
## 25804 BETHANY
## 25809 MADILL
## 25810 SAND SPRINGS
## 25816 MIDWEST CITY
## 25846 PONCA CITY
## 25847 SKIATOOK
## 25851 SEMINOLE
## 25858 PRYOR
## 25861 EDMOND
## 25884 MOORELAND
## 25899 GRESHAM
## 25900 EUGENE
## 25909 BEND
## 25913 SWEET HOME
## 25956 BEAVERTON
## 25974 COQUILLE
## 25984 KLAMATH FALLS
## 26019 SCIO
## 26026 LINCOLN CITY
## 26033 GEARHART
## 26071 FOREST GROVE
## 26072 MYRTLE CREEK
## 26109 SANDY
## 26111 REDMOND
## 26112 HOOD RIVER
## 26117 STAYTON
## 26118 KEIZER
## 26125 MILTON-FREEWATER
## 26127 CORVALLIS
## 26142 LAKE OSWEGO
## 26156 RAINIER
## 26160 WEST LINN
## 26164 HERMISTON
## 26166 ROSEBURG
## 26182 MILWAUKIE
## 26219 BANDON
## 26225 GRANTS PASS
## 26233 TROUTDALE
## 26237 BROOKINGS
## 26320 NORTH PLAINS
## 26330 MAPLETON
## 26344 WINSTON
## 26349 SCRANTON
## 26353 BALDWIN
## 26357 LEWISTOWN
## 26359 PHILADELPHIA
## 26360 WAMPUM
## 26379 JENKINTOWN
## 26391 CANONSBURG
## 26392 CRAFTON
## 26395 MURRYSVILLE
## 26401 POTTSTOWN
## 26404 NEW KENSINGTON
## 26412 FORTY FORT
## 26417 PITTSBURGH
## 26433 LANSDOWNE
## 26440 BLAIRSVILLE
## 26444 WHITE OAK
## 26446 COATESVILLE
## 26473 HUNTINGDON
## 26475 PITTSTON
## 26481 ALLENTOWN
## 26495 NORTH EAST
## 26498 MCKEESPORT
## 26501 HERMITAGE
## 26516 JEFFERSON HILLS
## 26544 MONONGAHELA
## 26574 MONESSEN
## 26583 KOPPEL
## 26609 STEWARTSTOWN
## 26633 BELLEFONTE
## 26636 DUNMORE
## 26658 HARRISBURG
## 26666 WEST CONSHOHOCKEN
## 26669 NORRISTOWN
## 26670 SAYRE
## 26685 OIL CITY
## 26687 PLUM
## 26696 ARCHBALD
## 26724 LEMOYNE
## 26730 TOWNSHIP OF NORTH HUNTINGDON
## 26738 DONEGAL
## 26747 CHARLEROI
## 26760 FALLSTON
## 26769 MOOSIC
## 26786 IRWIN
## 26798 PITCAIRN
## 26804 OLD STANTON
## 26822 WILKES-BARRE
## 26825 YARDLEY
## 26842 OSCEOLA MILLS
## 26859 MCKEES ROCKS
## 26871 DAUPHIN
## 26874 TOBYHANNA
## 26887 POTTSVILLE
## 26894 GREGG TOWNSHIP
## 26899 MOUNTVILLE
## 26910 BLAKELY
## 26914 UPPER MERION
## 26923 LARKSVILLE
## 26956 HORSHAM
## 26978 SHAMOKIN DAM
## 27000 COLLEGEVILLE
## 27008 NESQUEHONING
## 27022 CLAIRTON
## 27027 CHESWICK
## 27028 GILBERTON
## 27033 LANSFORD
## 27038 HEMPFIELD TOWNSHIP
## 27048 HEREFORD
## 27052 WHITE
## 27075 HAVERFORD
## 27081 LAMAR
## 27107 ETNA
## 27113 HARFORD
## 27116 WOOD
## 27117 UPPER HANOVER
## 27141 SHAMOKIN
## 27150 LONDON GROVE
## 27154 CHESTER TOWNSHIP
## 27161 CHAMBERSBURG
## 27163 UNIONTOWN
## 27166 HEGINS
## 27182 HELLERTOWN
## 27189 UPPER DARBY
## 27195 WALNUTPORT
## 27203 WILLIAMSPORT
## 27210 COLLINGDALE
## 27218 WILKES BARRE TOWNSHIP
## 27231 BEAVERTOWN
## 27250 TRAFFORD
## 27253 GREENE, TOWNSHIP
## 27283 RIDLEY PARK
## 27299 WEST HAZLETON
## 27309 NORTH BUFFALO
## 27315 PENNDEL
## 27320 SUGARLOAF
## 27350 DELAWARE WATER GAP
## 27353 JENNERS
## 27361 BUCKINGHAM
## 27365 GREEN TREE
## 27368 CLIFTON HEIGHTS
## 27379 WRIGHTSTOWN
## 27409 CRANSTON
## 27410 PAWTUCKET
## 27412 WOONSOCKET
## 27414 PROVIDENCE
## 27416 FOSTER
## 27417 SOUTH KINGSTOWN
## 27421 WESTERLY
## 27425 WEST WARWICK
## 27428 EAST GREENWICH
## 27433 JOHNSTON
## 27438 NORTH SMITHFIELD
## 27442 WEST GREENWICH
## 27444 WEST GLOCESTER
## 27445 EAST PROVIDENCE
## 27446 NEW SHOREHAM
## 27472 NARRAGANSETT PIER
## 27483 MYRTLE BEACH
## 27493 NORTH CHARLESTON
## 27497 MONCKS CORNER
## 27512 SPARTANBURG
## 27530 IRMO
## 27534 HANAHAN
## 27535 LADSON
## 27536 MEGGETT
## 27579 HEATH SPRINGS
## 27582 FORT MILL
## 27590 MAULDIN
## 27627 LOCKHART
## 27629 FOREST ACRES
## 27662 SUMTER
## 27692 WEST COLUMBIA
## 27696 MOUNT PLEASANT
## 27708 ROCK HILL
## 27728 NEWBERRY
## 27779 PORT ROYAL
## 27815 SIMPSONVILLE
## 27887 HILTON HEAD ISLAND
## 27894 GOOSE CREEK
## 27909 EDISTO ISLAND
## 27910 DILLON
## 27960 JOHNS ISLAND
## 27977 KIAWAH ISLAND
## 27991 NORTH MYRTLE BEACH
## 27995 VARNVILLE
## 28055 AWENDAW
## 28088 MULLINS
## 28104 PICKENS
## 28134 RAVENEL
## 28200 NORTH AUGUSTA
## 28264 LINCOLNVILLE
## 28277 AIKEN
## 28279 SHELDON
## 28363 DARLINGTON
## 28386 HARDEEVILLE
## 28396 BURNETTOWN
## 28409 PAGELAND
## 28422 SURFSIDE BEACH
## 28435 EASLEY
## 28449 SIOUX FALLS
## 28464 BIG STONE CITY
## 28466 RAPID CITY
## 28472 YANKTON
## 28530 PIERRE
## 28569 MEMPHIS
## 28574 KNOXVILLE
## 28580 MOUNT JULIET
## 28581 NASHVILLE
## 28585 EAST RIDGE
## 28586 GREENEVILLE
## 28602 CHATTANOOGA
## 28605 LA VERGNE
## 28612 CROSSVILLE
## 28613 JOHNSON CITY
## 28617 SODDY-DAISY
## 28632 KINGSPORT
## 28640 BLUFF CITY
## 28648 UNICOI
## 28666 SPRING HILL
## 28690 WOODLAND MILLS
## 28698 DYERSBURG
## 28711 GALLATIN
## 28722 SEVIERVILLE
## 28723 WATAUGA
## 28728 MAYNARDVILLE
## 28730 SELMER
## 28737 FARRAGUT
## 28742 GORDONSVILLE
## 28743 VONORE
## 28784 PEGRAM
## 28808 DICKSON
## 28818 JOELTON
## 28823 MURFREESBORO
## 28848 HARRIMAN
## 28849 COOKEVILLE
## 28851 GOODLETTSVILLE
## 28865 DECATURVILLE
## 28866 BRUCETON
## 28870 OLIVER SPRINGS
## 28873 HARTSVILLE
## 28874 MCKENZIE
## 28900 Coopertown
## 28921 OAK RIDGE
## 28922 LEWISBURG
## 28924 LENOIR CITY
## 28928 GATLINBURG
## 28933 PINEY FLATS
## 28958 BEAN STATION
## 28965 CALDERWOOD
## 28972 HUMBOLDT
## 29021 MONTEREY
## 29034 ROGERSVILLE
## 29051 Pittman Center
## 29121 MARYVILLE
## 29123 DOWELLTOWN
## 29134 KINGSTON SPRINGS
## 29146 TIPTONVILLE
## 29223 SIGNAL MOUNTAIN
## 29292 CUMBERLAND CITY
## 29306 CRUMP
## 29318 PIGEON FORGE
## 29350 SWEETWATER
## 29352 MOSHEIM
## 29378 BLOUNTVILLE
## 29389 BROWNSVILLE
## 29414 GLEASON
## 29484 COLLIERVILLE
## 29500 ELIZABETHTON
## 29513 GAINESBORO
## 29535 ERWIN
## 29604 LAWRENCEBURG
## 29605 DECHERD
## 29635 TELLICO PLAINS
## 29662 OLDTOWN
## 29667 FRIENDSHIP
## 29686 RIPLEY
## 29688 SAN ANTONIO
## 29691 KILLEEN
## 29692 LAREDO
## 29694 CORPUS CHRISTI
## 29700 GRAPEVINE
## 29708 CONVERSE
## 29712 SAN ANGELO
## 29713 LUBBOCK
## 29714 PHARR
## 29715 PORT ARTHUR
## 29718 DEL RIO
## 29720 FORT WORTH
## 29721 TYLER
## 29732 WACO
## 29733 BRYAN
## 29734 VIDOR
## 29739 LEWISVILLE
## 29743 LEVELLAND
## 29747 BAYTOWN
## 29748 TEXAS CITY
## 29751 SOUTHLAKE
## 29765 GARLAND
## 29766 COPPERAS COVE
## 29767 SHERMAN
## 29772 TIMPSON
## 29778 WICHITA FALLS
## 29781 CEDAR PARK
## 29782 ROUND ROCK
## 29787 LONGVIEW
## 29802 HARLINGEN
## 29804 FLOWER MOUND
## 29808 HEDLEY
## 29816 LEAKEY
## 29846 EDINBURG
## 29850 BAY CITY
## 29851 ENNIS
## 29862 CONROE
## 29863 ALLEN
## 29869 AMARILLO
## 29870 FREEPORT
## 29873 KILGORE
## 29876 FORNEY
## 29886 DEL VALLE
## 29898 HUMBLE
## 29905 FARMERS BRANCH
## 29912 IRVING
## 29921 WEATHERFORD
## 29940 EULESS
## 29942 THE WOODLANDS
## 29946 PFLUGERVILLE
## 29961 NEW CANEY
## 29964 NEW BRAUNFELS
## 29978 WAXAHACHIE
## 29979 CEDAR HILL
## 29987 MCKINNEY
## 29995 WEIMAR
## 29997 NEDERLAND
## 29998 SULPHUR SPRINGS
## 30003 GRAND PRAIRIE
## 30016 MISSOURI CITY
## 30028 BALCH SPRINGS
## 30037 AZLE
## 30056 KEMP
## 30068 KATY
## 30069 PORT NECHES
## 30072 FRISCO
## 30082 FORT HANCOCK
## 30096 TOMBALL
## 30115 SHEPHERD
## 30119 LA PORTE
## 30128 PECOS
## 30129 LEGGETT
## 30139 MESQUITE
## 30176 TEMPLE
## 30181 SAN JUAN
## 30182 PEASTER
## 30184 NEYLANDVILLE
## 30190 STREETMAN
## 30200 NACOGDOCHES
## 30207 RIO GRANDE CITY
## 30216 SUGAR LAND
## 30222 ROBINSON
## 30244 CLUTE
## 30257 MARQUEZ
## 30266 MABANK
## 30278 GALVESTON
## 30283 BELLAIRE
## 30284 MCALLEN
## 30287 VAN VLECK
## 30294 MELISSA
## 30297 HALTOM CITY
## 30319 OZONA
## 30320 LEONA
## 30322 GUNTER
## 30340 NOLANVILLE
## 30354 MINEOLA
## 30361 DENTON
## 30368 LITTLE ELM
## 30385 JARRELL
## 30408 GODLEY
## 30409 HURST
## 30420 BIG SPRING
## 30421 FLAT
## 30474 DALHART
## 30476 BULVERDE
## 30477 ESCOBARES
## 30478 RIVER OAKS
## 30526 RALLS
## 30537 RICHARDSON
## 30601 BRECKENRIDGE
## 30602 KERRVILLE
## 30607 STOCKDALE
## 30618 SINTON
## 30672 AVINGER
## 30680 ANGLETON
## 30701 LEONARD
## 30716 RICE
## 30733 COLEMAN
## 30758 LAKE JACKSON
## 30759 ROCKWALL
## 30761 BURLESON
## 30777 ALVARADO
## 30787 PROSPER
## 30792 NEW WAVERLY
## 30805 LEANDER
## 30813 GLEN ROSE
## 30817 KURTEN
## 30836 GRANBURY
## 30838 TYE
## 30846 QUEEN CITY
## 30850 SAN BENITO
## 30851 DICKINSON
## 30862 LA JOYA
## 30870 LEAGUE CITY
## 30889 CARMINE
## 30912 TOM BEAN
## 30914 HIGHLAND VILLAGE
## 30923 FOREST HILL
## 30958 BELLMEAD
## 30966 LA MARQUE
## 30967 ECTOR
## 30989 ROSENBERG
## 30995 COLLEGE STATION
## 30996 LUCAS
## 31009 ASHERTON
## 31026 NORTH RICHLAND HILLS
## 31029 CADDO MILLS
## 31038 TORNILLO
## 31045 LUFKIN
## 31061 WESLACO
## 31062 BROWNWOOD
## 31087 NORTH ZULCH
## 31092 MANOR
## 31166 ABBOTT
## 31225 DESOTO
## 31245 FALFURRIAS
## 31278 WHITEWRIGHT
## 31385 WILLIS
## 31389 YORKTOWN
## 31409 EL CAMPO
## 31441 ARANSAS PASS
## 31450 LOS INDIOS
## 31456 BRIDGE CITY
## 31488 CATARINA
## 31489 SCHERTZ
## 31502 BLOSSOM
## 31527 SOUR LAKE
## 31561 HEMPHILL
## 31594 VENUS
## 31595 KELLER
## 31659 INGLESIDE
## 31663 SHADY SHORES
## 31690 TERRELL
## 31715 SEALY
## 31735 ANNA
## 31746 SOUTH HOUSTON
## 31755 ROWLETT
## 31776 KYLE
## 31800 JERSEY VILLAGE
## 31809 BUDA
## 31834 CARRIZO SPRINGS
## 31862 ALICE
## 31864 SNYDER
## 31884 BORGER
## 31968 KAUFMAN
## 31981 SEAGOVILLE
## 31984 PORT LAVACA
## 32015 OAK POINT
## 32016 KINGSVILLE
## 32072 WOLFFORTH
## 32110 HEWITT
## 32130 MATADOR
## 32254 ALVIN
## 32281 WILMER
## 32312 STONEWALL
## 32319 HOLLYWOOD PARK
## 32322 MINERAL WELLS
## 32379 GILMER
## 32386 ELECTRA
## 32414 PEARSALL
## 32422 SALADO
## 32428 BRENHAM
## 32445 BENJAMIN
## 32472 ARGYLE
## 32504 WEST UNIVERSITY PLACE
## 32510 THE COLONY
## 32536 DONNA
## 32539 GOODRICH
## 32545 HONDO
## 32546 MAURICEVILLE
## 32548 WHITE SETTLEMENT
## 32564 ROBSTOWN
## 32601 KIRBY
## 32602 EMORY
## 32620 MARLIN
## 32632 HEARNE
## 32643 CORSICANA
## 32673 MULESHOE
## 32692 RICHARDS
## 32700 LACY-LAKEVIEW
## 32740 HUTCHINS
## 32744 FRIENDSWOOD
## 32749 LIBERTY HILL
## 32759 BALCONES HEIGHTS
## 32762 MCLENDON-CHISHOLM
## 32779 WILLS POINT
## 32785 JOSHUA
## 32794 SULLIVAN CITY
## 32795 DUNCANVILLE
## 32805 BOWIE
## 32860 CLEBURNE
## 32871 BRUCEVILLE-EDDY
## 32915 GOREE
## 32947 GALENA PARK
## 33026 RUNAWAY BAY
## 33047 CACTUS
## 33095 GLADEWATER
## 33135 CLINT
## 33144 HELOTES
## 33145 OAK RIDGE NORTH
## 33156 LEON VALLEY
## 33166 FAIR OAKS RANCH
## 33168 GUN BARREL CITY
## 33175 DEVINE
## 33198 MERCEDES
## 33208 SOUTH SALT LAKE
## 33214 HURRICANE
## 33215 SALT LAKE CITY
## 33217 PROVO
## 33218 OGDEN
## 33219 SAINT GEORGE
## 33223 MOAB
## 33224 ALTAMONT
## 33225 KANARRAVILLE
## 33226 MIDVALE
## 33228 HINCKLEY
## 33229 WEST VALLEY CITY
## 33230 PLEASANT GROVE
## 33231 HOLDEN
## 33232 LAYTON
## 33234 CEDAR CITY
## 33237 KAYSVILLE
## 33238 OREM
## 33242 BEAVER
## 33243 SOUTH JORDAN
## 33244 PAROWAN
## 33247 SANDY CITY
## 33248 EAGLE MOUNTAIN
## 33254 SEVIER
## 33257 TAYLORSVILLE
## 33258 DUCHESNE
## 33259 NEPHI
## 33264 RANDLETT
## 33267 WELLINGTON
## 33272 WEST JORDAN
## 33273 PARAGONAH
## 33281 TOQUERVILLE
## 33283 GENOLA
## 33285 MURRAY
## 33288 KANAB
## 33291 PRICE
## 33293 KEARNS
## 33294 SPANISH FORK
## 33298 WILLARD
## 33299 MONA
## 33300 BLANDING
## 33304 GREEN RIVER
## 33305 SIGURD
## 33310 BRYCE CANYON
## 33312 VIRGIN
## 33313 MOUNTAIN GREEN
## 33314 CEDAR HILLS
## 33317 MAGNA
## 33319 BLUFFDALE
## 33320 MORGAN
## 33329 WANSHIP
## 33330 WENDOVER
## 33331 HELPER
## 33340 HERRIMAN
## 33341 HOLLADAY
## 33342 ROY
## 33353 VERNAL
## 33355 MANTI
## 33356 JOSEPH
## 33357 SCIPIO
## 33363 FORT DUCHESNE
## 33365 ERDA
## 33374 TORREY
## 33378 GUNLOCK
## 33380 BRIGHAM CITY
## 33386 DUGWAY
## 33403 MYTON
## 33404 TOOELE
## 33406 ECHO
## 33414 ENOCH
## 33415 LEAMINGTON
## 33418 CORINNE
## 33427 LAVERKIN
## 33432 LEHI
## 33438 FERRON
## 33448 ANETH
## 33452 HEBER CITY
## 33463 IVINS
## 33464 DERBY CENTER
## 33466 SOUTH SHAFTSBURY
## 33467 SHELBURNE
## 33468 LYNDON
## 33470 HIGHGATE CENTER
## 33472 BENSON
## 33474 CUTTINGSVILLE
## 33475 MONTPELIER
## 33479 WHEELOCK
## 33489 GEORGIA CENTER
## 33490 SWANTON
## 33493 BARRE
## 33494 HINESBURG
## 33495 STARKSBORO
## 33497 MORRISVILLE
## 33498 MIDDLESEX
## 33499 RUTLAND
## 33501 LYNDONVILLE
## 33502 JERICHO
## 33505 SOUTH BURLINGTON
## 33511 BRATTLEBORO
## 33514 CASTLETON
## 33515 WEST WARDSBORO
## 33516 FERRISBURGH
## 33517 WAITSFIELD
## 33523 CHESAPEAKE
## 33531 VIRGINIA BEACH
## 33532 LYNCHBURG
## 33535 NEWPORT NEWS
## 33549 SUFFOLK
## 33564 NORFOLK
## 33608 BERGTON
## 33618 DUMFRIES
## 33635 POQUOSON
## 33695 HARRISONBURG
## 33697 TAPPAHANNOCK
## 33744 FREDERICKSBURG
## 33803 EXMORE
## 33882 CHILHOWIE
## 33883 STONY CREEK
## 33918 NARROWS
## 33970 HILLSVILLE
## 33995 CULPEPER
## 34001 CHARLOTTESVILLE
## 34043 STAUNTON
## 34056 CLINCHPORT
## 34062 MANASSAS
## 34086 SHENANDOAH
## 34114 CHRISTIANSBURG
## 34137 BELLE HAVEN
## 34170 WYTHEVILLE
## 34171 DUFFIELD
## 34228 CREWE
## 34308 CAPE CHARLES
## 34318 SPOKANE
## 34321 SEATTLE
## 34324 ANACORTES
## 34331 OLYMPIA
## 34335 LYNNWOOD
## 34336 VANCOUVER
## 34338 KENT
## 34345 YAKIMA
## 34347 KENNEWICK
## 34350 AIRWAY HEIGHTS
## 34353 FEDERAL WAY
## 34356 EVERETT
## 34367 KELSO
## 34369 STEILACOOM
## 34375 TACOMA
## 34382 MOUNTLAKE TERRACE
## 34383 TUMWATER
## 34391 FIFE
## 34404 ISSAQUAH
## 34413 RENTON
## 34419 SEDRO-WOOLLEY
## 34423 SPOKANE VALLEY
## 34432 TUKWILA
## 34439 GIG HARBOR
## 34440 CHELAN
## 34443 LACEY
## 34447 PULLMAN
## 34455 SHORELINE
## 34501 PUYALLUP
## 34507 SEATAC
## 34531 OTHELLO
## 34554 WOODINVILLE
## 34575 CAMAS
## 34590 PASCO
## 34601 OMAK
## 34631 MOXEE CITY
## 34635 BATTLE GROUND
## 34639 BOTHELL
## 34644 UNIVERSITY PLACE
## 34697 BREMERTON
## 34719 ENUMCLAW
## 34732 NACHES
## 34742 OAK HARBOR
## 34766 MAPLE VALLEY
## 34768 HOQUIAM
## 34788 EDMONDS
## 34800 SEQUIM
## 34811 LAKE STEVENS
## 34843 CLEAR CREEK
## 34844 INWOOD
## 34845 CAPON BRIDGE
## 34846 MARTINSBURG
## 34848 NEOLA
## 34849 RANSON
## 34850 RUPERT
## 34851 NEW RICHMOND
## 34852 CHARLES TOWN
## 34853 MILLWOOD
## 34856 CLENDENIN
## 34857 BIG CHIMNEY
## 34862 WALKER
## 34863 CROWN
## 34864 PARKERSBURG
## 34866 CLARKSBURG
## 34867 BUCKHANNON
## 34868 SUMMERSVILLE
## 34870 FALLING WATERS
## 34871 LOWER BELLE
## 34872 CRUM
## 34873 RACINE
## 34874 BRUCETON MILLS
## 34875 OAK HILL
## 34877 BERKELEY SPRINGS
## 34878 BOWDEN
## 34884 SISTERSVILLE
## 34885 BLOOMERY
## 34887 BRAMWELL
## 34889 ALUM CREEK
## 34890 FRENCH CREEK
## 34891 CHAPMANVILLE
## 34893 SISSONVILLE
## 34894 SPRING DALE
## 34896 BLUEFIELD
## 34898 RAVENSWOOD
## 34902 EAST LYNN
## 34904 RONCEVERTE
## 34905 RAINELLE
## 34906 NEW MILTON
## 34908 MORGANTOWN
## 34909 GLEN JEAN
## 34914 ELKINS
## 34918 HEDGESVILLE
## 34919 SCARBRO
## 34920 WALKERSVILLE
## 34921 KOPPERSTON
## 34923 MASONTOWN
## 34926 ROMNEY
## 34927 MONTCALM
## 34928 MEADOW BRIDGE
## 34930 LIZEMORES
## 34931 SHEPHERDSTOWN
## 34935 FALLING SPRING
## 34936 CLEAR FORK
## 34947 LOOKOUT
## 34951 BUNKER HILL
## 34952 DUNBAR
## 34955 FLEMINGTON
## 34958 COTTAGEVILLE
## 34960 WELCH
## 34965 KEARNEYSVILLE
## 34967 MOUNDSVILLE
## 34973 HARPERS FERRY
## 34976 LEON
## 34979 SCHERR
## 34980 SAINT MARYS
## 34983 DANIELS
## 34984 SHENANDOAH JUNCTION
## 34986 DAILEY
## 34987 SLANESVILLE
## 34990 CABIN CREEK
## 34992 NEWBURG
## 34993 NEW MARTINSVILLE
## 34997 WHITE SULPHUR SPRINGS
## 35001 CRAIGSVILLE
## 35003 SMITHBURG
## 35013 MOUNT STORM
## 35014 NEW CREEK
## 35018 NEWELL
## 35019 SWEETLAND
## 35020 GRAFTON
## 35021 POINT PLEASANT
## 35026 GALLAGHER
## 35027 TEAYS
## 35029 SANDYVILLE
## 35030 PREMIER
## 35034 LASHMEET
## 35037 BRANCHLAND
## 35039 EAST BANK
## 35041 OLD FIELDS
## 35042 DELBARTON
## 35043 CANVAS
## 35044 HUTTONSVILLE
## 35047 BRADSHAW
## 35050 YELLOW SPRING
## 35053 LAVALETTE
## 35057 BLUEWELL
## 35058 RAMAGE
## 35061 RED HOUSE
## 35062 WEIRTON
## 35065 SAINT ALBANS
## 35066 READER
## 35067 LITTLE BIRCH
## 35072 NEW MANCHESTER
## 35074 MANNINGTON
## 35075 VALLEY HEAD
## 35076 KENOVA
## 35081 SHANKS
## 35084 GREEN SPRING
## 35091 UPPER TRACT
## 35094 MILWAUKEE
## 35096 PLEASANT PRAIRIE
## 35100 WAUKESHA
## 35103 CHIPPEWA FALLS
## 35116 TWIN LAKES
## 35117 KENOSHA
## 35121 FOND DU LAC
## 35123 MONONA
## 35127 GENOA CITY
## 35134 DRESSER
## 35156 OSHKOSH
## 35157 BELOIT
## 35169 SUAMICO
## 35175 SHAWANO
## 35184 SUN PRAIRIE
## 35205 MINERAL POINT
## 35217 WINTER
## 35224 ONALASKA
## 35225 EAU CLAIRE
## 35226 SISTER BAY
## 35230 KAUKAUNA
## 35238 WEST ALLIS
## 35252 WISCONSIN RAPIDS
## 35256 WAUSAU
## 35260 GREEN BAY
## 35277 MIDDLETON
## 35295 HATLEY
## 35302 LA CROSSE
## 35312 ASHWAUBENON
## 35324 KOHLER
## 35333 CALEDONIA
## 35366 WAUWATOSA
## 35377 MANITOWOC
## 35413 SOUTH MILWAUKEE
## 35428 SHEBOYGAN
## 35468 LAKE DELTON
## 35475 NEENAH
## 35484 PEWAUKEE
## 35502 KNAPP
## 35516 ALGOMA
## 35542 WHEELER
## 35571 ROCK SPRINGS
## 35572 APPLETON
## 35607 PORT EDWARDS
## 35609 WEST MILWAUKEE
## 35655 LARAMIE
## 35660 CASPER
## 35663 CHEYENNE
## 35681 RANCHESTER
## 35684 GILLETTE
## 35714 RAWLINS
## 35718 GUERNSEY
## 35733 CODY
## 35757 LANDER
unique(datos["STATENAME"])
## STATENAME
## 1 Alabama
## 853 Alaska
## 906 Arizona
## 1873 Arkansas
## 2458 California
## 6016 Colorado
## 6590 Connecticut
## 6869 Delaware
## 6973 District of Columbia
## 7007 Florida
## 10105 Georgia
## 11627 Hawaii
## 11708 Idaho
## 11896 Illinois
## 12983 Indiana
## 13798 Iowa
## 14102 Kansas
## 14484 Kentucky
## 15193 Louisiana
## 15955 Maine
## 16106 Maryland
## 16646 Massachusetts
## 16973 Michigan
## 17984 Minnesota
## 18353 Mississippi
## 19040 Missouri
## 19954 Montana
## 20144 Nebraska
## 20361 Nevada
## 20654 New Hampshire
## 20752 New Jersey
## 21299 New Mexico
## 21664 New York
## 22627 North Carolina
## 24039 North Dakota
## 24135 Ohio
## 25289 Oklahoma
## 25888 Oregon
## 26349 Pennsylvania
## 27409 Rhode Island
## 27475 South Carolina
## 28437 South Dakota
## 28569 Tennessee
## 29688 Texas
## 33208 Utah
## 33464 Vermont
## 33522 Virginia
## 34318 Washington
## 34843 West Virginia
## 35092 Wisconsin
## 35653 Wyoming
#Contamos cuantas veces aparecen cada una de los posibles valores dentro de cada variable, esto nos dará una idea de dónde se producen más accidentes en cada, entorno, ciudad y estado
table(datos$RUR_URBNAME)
##
## Not Reported Rural
## 348 15033
## Trafficway Not in State Inventory Unknown
## 69 83
## Urban
## 20233
table(datos$CITYNAME)
##
## ABBEVILLE ABBOTT
## 3 1
## ABERDEEN ABILENE
## 6 14
## ABINGTON ABIQUIU
## 1 1
## ACTON ACWORTH
## 2 1
## ADA ADAMSVILLE
## 2 2
## ADDIS ADDISON
## 1 3
## ADEL ADELANTO
## 2 2
## ADRIAN AFTON
## 2 2
## AHOSKIE AIKEN
## 1 1
## AIRMONT AIRWAY HEIGHTS
## 1 1
## AJO AKRON
## 1 30
## ALABASTER ALACHUA
## 1 5
## ALAMEDA ALAMO
## 1 2
## ALAMOGORDO ALAMOSA
## 1 1
## ALAPAHA ALBANY
## 1 24
## ALBERTVILLE ALBION
## 2 3
## ALBUQUERQUE ALEXANDER
## 101 1
## ALEXANDER CITY ALEXANDRIA
## 1 10
## ALGOMA ALHAMBRA
## 1 2
## ALICE ALLEGANY
## 1 1
## ALLEN ALLEN PARK
## 4 1
## ALLENDALE ALLENTOWN
## 1 7
## ALLIANCE ALNA
## 1 1
## ALPENA ALPHARETTA
## 1 2
## ALPINE ALTAMONT
## 4 1
## ALTAMONTE SPRINGS ALTMAR
## 3 1
## ALTON ALUM CREEK
## 6 2
## ALVARADO ALVIN
## 1 3
## AMALIA AMARILLO
## 1 23
## AMENIA AMERICAN CANYON
## 3 3
## AMHERST AMITE
## 7 2
## AMSTERDAM ANACORTES
## 1 3
## ANADARKO ANAHEIM
## 1 27
## ANAMOSA ANCHORAGE
## 1 14
## ANDERSON ANDOVER
## 9 6
## ANETH ANGIER
## 1 1
## ANGLETON ANGOLA
## 3 1
## ANKENY ANN ARBOR
## 1 4
## ANNA ANNISTON
## 1 4
## ANSONIA ANTHONY
## 1 1
## ANTIOCH ANTWERP
## 8 2
## APACHE JUNCTION APOPKA
## 5 9
## APPLE VALLEY APPLETON
## 11 1
## APPLING ARANSAS PASS
## 1 1
## ARBUTUS ARCADIA
## 1 3
## ARCHBALD ARDEN
## 1 2
## ARDMORE ARDSLEY
## 4 1
## ARGENTA ARGOS
## 1 1
## ARGYLE ARLINGTON
## 1 33
## ARLINGTON HEIGHTS ARNOLD
## 4 3
## ARROYO GRANDE ARROYO SECO
## 1 1
## ARTESIA ARVADA
## 1 4
## ARVIN ARY
## 1 1
## ASHEBORO ASHERTON
## 2 1
## ASHEVILLE ASHLAND
## 15 4
## ASHTABULA ASHVILLE
## 1 2
## ASHWAUBENON ASPEN
## 3 1
## ATASCADERO ATCHISON
## 1 2
## ATHENS ATHERTON
## 20 1
## ATLANTA ATLANTIC CITY
## 68 3
## ATLANTIS ATTALLA
## 2 1
## AUBURN AUBURNDALE
## 24 3
## AUGUSTA AULT
## 30 1
## AURORA AUSTELL
## 48 3
## AUSTERLITZ AUSTIN
## 2 88
## AVENAL AVENTURA
## 2 1
## AVINGER AVOCA
## 1 1
## AVON AVONDALE
## 5 7
## AWENDAW AYDEN
## 3 1
## AZLE AZUSA
## 1 4
## BABYLON BAGLEY
## 15 1
## BAKER BAKERSFIELD
## 3 48
## BAL HARBOUR BALCH SPRINGS
## 1 4
## BALCONES HEIGHTS BALD KNOB
## 1 1
## BALDWIN BALDWIN CITY
## 1 1
## BALDWIN PARK BALL GROUND
## 3 1
## BALLWIN BALTIMORE
## 1 58
## BANDON BANGOR
## 1 5
## BANGOR TOWNSHIP BANNING
## 1 1
## BANNOCKBURN BAPCHULE
## 1 2
## BAR HARBOR BARAGA
## 2 2
## BARBERTON BARBOURVILLE
## 2 1
## BARDSTOWN BARRE
## 2 1
## BARSTOW BARTLETT
## 5 4
## BARTON BARTONVILLE
## 1 1
## BARTOW BASEHOR
## 3 1
## BASTROP BATAVIA
## 5 3
## BATESVILLE BATH
## 2 2
## BATON ROUGE BATTLE CREEK
## 53 9
## BATTLE GROUND BAY CITY
## 1 1
## BAY MINETTE BAY SPRINGS
## 1 1
## BAYBORO BAYONNE
## 1 2
## BAYTOWN BEACH
## 11 1
## BEACHWOOD BEACON
## 1 1
## BEACON FALLS BEAN STATION
## 1 2
## BEATRICE BEAUMONT
## 1 34
## BEAVER BEAVER CREEK
## 4 2
## BEAVERTON BEAVERTOWN
## 3 1
## BECKET BEDFORD
## 1 6
## BEDFORD PARK BEDMINSTER
## 1 2
## BEECH GROVE BEL AIR
## 1 1
## BELCOURT BELEN
## 1 2
## BELFAST BELGRADE
## 3 1
## BELL BELL GARDENS
## 2 1
## BELLA VISTA BELLAIRE
## 1 2
## BELLE GLADE BELLE HAVEN
## 2 1
## BELLE ROSE BELLEFONTAINE NEIGHBORS
## 1 3
## BELLEFONTE BELLEVIEW
## 1 1
## BELLEVILLE BELLEVUE
## 7 7
## BELLFLOWER BELLINGHAM
## 5 2
## BELLMAWR BELLMEAD
## 2 2
## BELLWOOD BELMONT
## 1 5
## BELOIT BELTON
## 3 3
## BELTSVILLE BELVIDERE
## 2 1
## BEMIDJI BEND
## 2 2
## BENHAM BENJAMIN
## 1 1
## BENSENVILLE BENSON
## 2 1
## BENTON BENTON HARBOR
## 2 1
## BENTON HEIGHTS BENTONVILLE
## 1 4
## BEREA BERGEN
## 3 3
## BERGTON BERINO
## 1 2
## BERKELEY BERKELEY SPRINGS
## 9 1
## BERKLEY BERNALILLO
## 2 2
## BERWICK BERWYN
## 4 1
## BERWYN HEIGHTS BESSEMER
## 1 10
## BETHANY BETHEL
## 2 3
## BETHLEHEM BEVINSVILLE
## 5 1
## BIG BEAR LAKE BIG CHIMNEY
## 1 2
## BIG FLATS BIG RAPIDS
## 1 1
## BIG SPRING BIG STONE CITY
## 5 1
## BILLINGS BILOXI
## 6 11
## BIRCH RUN BIRD CITY
## 1 1
## BIRMINGHAM BISCOE
## 43 1
## BISMARCK BLACK CREEK
## 4 1
## BLACKSHEAR BLADENSBURG
## 1 2
## BLAINE BLAIR
## 2 1
## BLAIRSVILLE BLAKELY
## 1 2
## BLANCHARD BLANCHESTER
## 2 1
## BLANDING BLEDSOE
## 1 1
## BLOOMERY BLOOMFIELD
## 1 3
## BLOOMFIELD VILLAGE BLOOMING GROVE
## 1 1
## BLOOMINGBURG BLOOMINGDALE
## 1 1
## BLOOMINGTON BLOSSOM
## 15 1
## BLOUNTSVILLE BLOUNTVILLE
## 1 1
## BLUE EARTH BLUE HILL
## 1 1
## BLUE ISLAND BLUE MOUND
## 3 1
## BLUE RIDGE BLUE SPRINGS
## 1 1
## BLUEFIELD BLUEWELL
## 3 1
## BLUFF CITY BLUFFDALE
## 2 2
## BLUFFTON BLYTHE
## 3 3
## BLYTHEVILLE BOAZ
## 2 1
## BOCA RATON BODENBURG BUTTE
## 11 1
## BOGALUSA BOGART
## 1 1
## BOISE BOLINGBROOK
## 9 3
## BOLTON BOMBAY
## 3 1
## BONITA SPRINGS BONNER SPRINGS
## 1 2
## BONNERS FERRY BONNYMAN
## 1 1
## BOONE BOONEVILLE
## 4 1
## BOONVILLE BORGER
## 3 1
## BOSCAWEN BOSSIER CITY
## 1 8
## BOSTON BOSTON HEIGHTS
## 18 1
## BOTHELL BOULDER
## 1 3
## BOUND BROOK BOURBONNAIS
## 1 1
## BOURNE BOWDEN
## 4 1
## BOWDON BOWIE
## 1 1
## BOWLING GREEN BOXFORD
## 9 1
## BOYLSTON BOYNTON BEACH
## 1 14
## BRADENTON BRADFORD
## 7 1
## BRADLEY BRADSHAW
## 1 1
## BRAINERD BRAMWELL
## 2 1
## BRANCHBURG PARK BRANCHLAND
## 2 1
## BRANDENBURG BRANDON
## 1 2
## BRANFORD BRANT
## 2 2
## BRASELTON BRATTLEBORO
## 1 1
## BRAWLEY BRAZIL
## 1 2
## BREAUX BRIDGE BRECKENRIDGE
## 1 1
## BREMEN BREMERTON
## 1 1
## BRENHAM BRENTWOOD
## 1 9
## BREWER BREWSTER
## 1 1
## BREWTON BRIDGE CITY
## 1 3
## BRIDGEBORO BRIDGEPORT
## 1 17
## BRIDGETON BRIDGEVIEW
## 4 1
## BRIDGEVILLE BRIDGEWATER
## 3 2
## BRIGANTINE BRIGHAM CITY
## 1 3
## BRIGHTON BRIMFIELD
## 10 2
## BRISTOL BROADALBIN
## 9 1
## BROCKTON BROKEN ARROW
## 8 4
## BROOK PARK BROOKFIELD
## 1 2
## BROOKHAVEN BROOKINGS
## 28 1
## BROOKLAWN BROOKLINE
## 1 1
## BROOKLINE VILLAGE BROOKLYN
## 1 2
## BROOKLYN CENTER BROOKLYN PARK
## 6 3
## BROOKSVILLE BROOKVILLE
## 7 3
## BROOMFIELD BROUSSARD
## 4 1
## BROWNFIELD BROWNING
## 2 1
## BROWNSBURG BROWNSTOWN TOWNSHIP
## 2 1
## BROWNSVILLE BROWNWOOD
## 8 1
## BROXTON BRUCETON
## 1 1
## BRUCETON MILLS BRUCEVILLE-EDDY
## 2 1
## BRUNDIDGE BRUNSWICK
## 1 5
## BRUSH BRYAN
## 1 10
## BRYANT BRYCE CANYON
## 1 1
## BUCHANAN BUCKEYE
## 3 17
## BUCKHANNON BUCKINGHAM
## 4 1
## BUCKSPORT BUDA
## 3 2
## BUENA PARK BUFFALO
## 2 15
## BUFFALO GROVE BULLHEAD CITY
## 3 6
## BULVERDE BUNKER HILL
## 2 2
## BURBANK BURLESON
## 4 5
## BURLINGAME BURLINGTON
## 2 16
## BURLINGTON TOWNSHIP BURNETTOWN
## 1 1
## BURNS FLAT BURNS HARBOR
## 1 1
## BURNSVILLE BURTON
## 2 3
## BUSTI BUTLER
## 1 1
## BUTTE BUXTON
## 2 1
## BYLAS BYNG
## 1 1
## BYRON CABIN CREEK
## 2 1
## CABOT CACTUS
## 2 1
## CADDO MILLS CADILLAC
## 1 1
## CADIZ CAHOKIA
## 2 1
## CAIRO CALABASAS
## 5 1
## CALDERWOOD CALDWELL
## 2 4
## CALEDONIA CALERA
## 3 2
## CALEXICO CALHOUN CITY
## 1 1
## CALIFORNIA CALIFORNIA CITY
## 1 2
## CALLAWAY CALLICOON
## 2 2
## CALUMET CITY CALUMET PARK
## 3 1
## CAMAS CAMBRIDGE
## 2 1
## CAMDEN CAMERON
## 13 1
## CAMILLA CAMILLUS
## 1 2
## CAMP HILL CAMP SPRINGS
## 1 1
## CAMP VERDE CAMPBELL
## 2 1
## CAMPBELLSBURG CAMPBELLSVILLE
## 1 1
## CAMPTON CANAAN
## 1 1
## CANAL WINCHESTER CANANDAIGUA
## 1 3
## CANASTOTA CANDIA
## 2 1
## CANDOR CANNON FALLS
## 3 1
## CANONSBURG CANTERBURY
## 1 2
## CANTON CANTON TOWNSHIP
## 10 3
## CANVAS CAPE CHARLES
## 1 1
## CAPE CORAL CAPE GIRARDEAU
## 16 4
## CAPITOL HEIGHTS CAPON BRIDGE
## 1 1
## CARBONDALE CARDIFF BY THE SEA
## 2 1
## CARENCRO CARIBOU
## 2 1
## CARL CARLISLE
## 1 3
## CARLSBAD CARMEL
## 8 4
## CARMI CARMINE
## 1 1
## CARNEYS POINT CARO
## 2 1
## CAROL STREAM CARP LAKE
## 1 1
## CARPINTERIA CARRIZO SPRINGS
## 1 1
## CARROLLTON CARSON
## 13 7
## CARSON CITY CARTER
## 1 1
## CARTERSVILLE CARTHAGE
## 10 3
## CARTWRIGHT CARUTHERSVILLE
## 1 1
## CARY CASA GRANDE
## 2 4
## CASEYVILLE CASPER
## 1 3
## CASSELBERRY CASSVILLE
## 4 6
## CASTILE CASTLE ROCK
## 1 1
## CASTLETON CATALINA
## 1 1
## CATARINA CATHEDRAL CITY
## 1 7
## CATLETTSBURG CATOOSA
## 1 1
## CAVE CITY CAYUGA
## 1 1
## CAZENOVIA CA\xd1ON CITY
## 1 1
## CEDAR CITY CEDAR FALLS
## 3 1
## CEDAR HILL CEDAR HILLS
## 4 1
## CEDAR PARK CEDAR RAPIDS
## 1 5
## CEDAR SPRINGS CEDARTOWN
## 1 2
## CELINA CENTENNIAL
## 2 4
## CENTER LINE CENTEREACH
## 1 1
## CENTERVILLE CENTRAL
## 4 1
## CENTRAL ISLIP CENTRALIA
## 3 3
## CENTRE CENTREVILLE
## 1 5
## CERES CERRITOS
## 2 5
## CHAMBERS CHAMBERSBURG
## 2 1
## CHAMBLEE CHAMPAIGN
## 1 3
## CHANDLER CHANNAHON
## 17 1
## CHAPEL HILL CHAPLIN
## 1 1
## CHAPMANVILLE CHARITON
## 1 2
## CHARLEROI CHARLES TOWN
## 1 3
## CHARLESTON CHARLESTOWN
## 24 4
## CHARLEVOIX CHARLOTTE
## 1 99
## CHARLOTTESVILLE CHARLTON
## 5 1
## CHARLTON DEPOT CHATSWORTH
## 1 2
## CHATTAHOOCHEE CHATTANOOGA
## 1 28
## CHEBOYGAN CHEEKTOWAGA
## 1 4
## CHELAN CHELMSFORD
## 1 3
## CHELSEA CHEMUNG
## 1 1
## CHENANGO BRIDGE CHERRY HILL
## 1 4
## CHERRY HILLS VILLAGE CHERRYVALE
## 1 1
## CHESAPEAKE CHESHIRE
## 12 4
## CHESTER CHESTER TOWNSHIP
## 5 1
## CHESTERFIELD CHESTERFIELD TOWNSHIP
## 3 3
## CHESTERTON CHESWICK
## 2 1
## CHEVERLY CHEYENNE
## 2 8
## CHICAGO CHICAGO HEIGHTS
## 177 2
## CHICAGO RIDGE CHICHESTER
## 2 1
## CHICKAMAUGA CHICKASHA
## 1 4
## CHICO CHICOPEE
## 7 5
## CHIEFLAND CHILHOWIE
## 1 1
## CHILLICOTHE CHINA GROVE
## 1 2
## CHINLE CHINO
## 1 6
## CHINO HILLS CHINO VALLEY
## 2 1
## CHIPPEWA FALLS CHISHOLM
## 1 1
## CHRISTIANSBURG CHULA VISTA
## 2 7
## CHURCH ROCK CHURCHVILLE
## 2 1
## CICERO CIMARRON
## 4 2
## CINCINNATI CINNAMINSON
## 36 2
## CIRCLEVILLE CITRUS HEIGHTS
## 6 4
## CLAIRTON CLANTON
## 1 2
## CLAREMONT CLARENCE
## 7 2
## CLARION CLARK
## 1 2
## CLARKESVILLE CLARKSBURG
## 1 1
## CLARKSDALE CLARKSON
## 3 1
## CLARKSVILLE CLAVERACK
## 22 1
## CLAXTON CLAY
## 1 2
## CLAY CENTER CLAY CITY
## 1 2
## CLAYMONT CLAYTON
## 2 8
## CLEAR CREEK CLEAR FORK
## 1 1
## CLEAR LAKE CLEARLAKE
## 2 5
## CLEARWATER CLEBURNE
## 4 1
## CLEMMONS CLENDENIN
## 1 2
## CLERMONT CLEVELAND
## 9 86
## CLEWISTON CLIFF
## 1 1
## CLIFTON CLIFTON HEIGHTS
## 5 2
## CLIFTON PARK CLINCHPORT
## 2 1
## CLINT CLINTON
## 1 18
## CLINTON TOWNSHIP CLIO
## 3 1
## CLOCKVILLE CLOQUET
## 1 1
## CLOUDCROFT CLOVIS
## 1 10
## CLUTE CLYDE
## 2 4
## CLYMER COACHELLA
## 1 2
## COAL GROVE COATESVILLE
## 1 1
## COATS COCHITI PUEBLO
## 1 1
## COCOA COCOA BEACH
## 4 4
## COCONUT CREEK CODY
## 5 1
## COEUR D'ALENE COFFEYVILLE
## 2 1
## COHUTTA COLCHESTER
## 1 2
## COLD SPRING COLEMAN
## 3 1
## COLERAINE COLFAX
## 1 1
## COLLEGE PARK COLLEGE STATION
## 9 2
## COLLEGEVILLE COLLIERVILLE
## 1 3
## COLLINGDALE COLLINGSWOOD
## 1 1
## COLLINS COLLINSVILLE
## 1 2
## COLONIE COLORADO SPRINGS
## 3 49
## COLT COLTON
## 1 5
## COLUMBIA COLUMBIA CITY
## 32 2
## COLUMBIA FALLS COLUMBIA HEIGHTS
## 1 2
## COLUMBIANA COLUMBINE VALLEY
## 1 1
## COLUMBUS COMMERCE
## 109 8
## COMMERCE CITY COMPTON
## 5 18
## COMSTOCK CONCORD
## 1 17
## CONGRESS CONNEAUT
## 3 2
## CONOVER CONROE
## 1 9
## CONSTANTIA CONVERSE
## 3 4
## CONWAY CONYERS
## 8 7
## COOKEVILLE COOL VALLEY
## 2 1
## COOLIDGE COON RAPIDS
## 3 3
## COOPER CITY Coopertown
## 2 5
## COPPERAS COVE COQUILLE
## 3 1
## CORAL SPRINGS CORAM
## 8 1
## CORBIN CORCORAN
## 3 1
## CORDELE CORINNA
## 2 1
## CORINNE CORINTH
## 1 5
## CORNELIUS CORNING
## 2 1
## CORNISH CORNVILLE
## 1 1
## CORNWALL-ON-HUDSON CORONA
## 2 14
## CORPUS CHRISTI CORSICANA
## 30 2
## CORTEZ CORTLAND
## 3 2
## CORTLANDT CORUNNA
## 2 1
## CORVALLIS CORYDON
## 2 1
## COSTA MESA COTATI
## 5 1
## COTTAGEVILLE COTTLEVILLE
## 3 1
## COTTONWOOD COUNCIL BLUFFS
## 6 8
## COUNCIL GROVE COUNTRY CLUB HILLS
## 1 3
## COUSHATTA COVERT
## 3 3
## COVINA COVINGTON
## 1 12
## COWETA CRAB ORCHARD
## 2 4
## CRAFTON CRAIGSVILLE
## 1 1
## CRANBURY CRANFORD
## 2 3
## CRANSTON CRAWFORD
## 3 1
## CRAWFORDSVILLE CRESSKILL
## 2 1
## CREST HILL CRESTVIEW
## 2 5
## CRESTVIEW HILLS CRETE
## 1 3
## CREVE COEUR CREWE
## 1 1
## CROGHAN CROMWELL
## 1 2
## CROSSVILLE CROTON-ON-HUDSON
## 4 1
## CROWLEY CROWN
## 2 1
## CROWN POINT CROWNPOINT
## 5 2
## CRUM CRUMP
## 1 1
## CRYSTAL LAKE CRYSTAL RIVER
## 2 1
## CUDDEBACKVILLE CULLMAN
## 1 2
## CULPEPER CULVER
## 1 1
## CULVER CITY CUMBERLAND
## 3 1
## CUMBERLAND CENTER CUMBERLAND CITY
## 1 1
## CUMMING CUPERTINO
## 3 2
## CUSHING CUSSETA
## 1 1
## CUTLER BAY CUTTINGSVILLE
## 1 1
## CUYAHOGA FALLS CYPRESS
## 1 1
## D'IBERVILLE DACONO
## 1 1
## DACULA DADE CITY
## 1 1
## DADEVILLE DAFTER
## 1 1
## DAHLONEGA DAILEY
## 1 1
## DALEVILLE DALHART
## 1 3
## DALLAS DALLAS CITY
## 209 1
## DALTON DALY CITY
## 2 1
## DAMARISCOTTA DANA POINT
## 1 3
## DANBURY DANIA BEACH
## 1 10
## DANIELS DANIELSVILLE
## 1 1
## DANVERS DANVILLE
## 3 17
## DAPHNE DARDANELLE
## 2 1
## DARIEN DARLINGTON
## 4 1
## DAUPHIN DAVENPORT
## 1 14
## DAVIE DAVIS
## 15 3
## DAWSON DAWSONVILLE
## 2 1
## DAYTON DAYTONA BEACH
## 30 25
## DE FUNIAK SPRINGS DEARBORN
## 3 2
## DEARBORN HEIGHTS DEBARY
## 1 3
## DECATUR DECATURVILLE
## 22 1
## DECHERD DEDHAM
## 1 2
## DEER GROVE DEERFIELD
## 1 2
## DEERFIELD BEACH DEFERIET
## 9 1
## DEL CITY DEL RIO
## 1 1
## DEL VALLE DELAND
## 1 7
## DELANO DELAWARE
## 2 2
## DELAWARE CITY DELAWARE WATER GAP
## 1 1
## DELBARTON DELHI
## 1 1
## DELLWOOD DELMAR
## 2 2
## DELPHI DELRAY BEACH
## 2 3
## DELTA MILLS DELTONA
## 1 7
## DEMING DEMOREST
## 1 1
## DENALI DENHAM SPRINGS
## 1 2
## DENISON DENMARK
## 4 1
## DENNIS DENTON
## 1 13
## DENVER DENVILLE
## 51 1
## DEPOSIT DEPTFORD
## 3 4
## DEQUINCY DERBY
## 2 2
## DERBY CENTER DERIDDER
## 3 3
## DERRY VILLAGE DES MOINES
## 3 18
## DES PLAINES DESERT HOT SPRINGS
## 1 7
## DESOTO DESTIN
## 4 6
## DETROIT DEVINE
## 175 1
## DEWEY-HUMBOLDT DIAMOND BAR
## 2 6
## DIAZ DIBBLE
## 1 2
## DICKINSON DICKSON
## 2 3
## DIETERICH DILKON
## 1 1
## DILLON DINUBA
## 1 2
## DIXON DOBSON
## 3 1
## DODGE CITY DOLAN SPRINGS
## 3 1
## DOLTON DONALDSONVILLE
## 6 1
## DONALSONVILLE DONEGAL
## 1 1
## DONNA DORAL
## 1 4
## DORAVILLE DOTHAN
## 1 7
## DOUGLAS DOUGLASVILLE
## 6 3
## DOVER DOWELLTOWN
## 7 1
## DOWNERS GROVE DOWNEY
## 3 8
## DOWNSVILLE DOYLINE
## 1 1
## DRACUT DRESDEN
## 1 2
## DRESSER DRY BRANCH
## 1 1
## DRY RIDGE DRYDEN
## 2 1
## DUANESBURG DUARTE
## 1 1
## DUBLIN DUBUQUE
## 7 2
## DUCHESNE DUFFIELD
## 1 1
## DUGWAY DULCE
## 1 2
## DULUTH DUMAS
## 4 1
## DUMFRIES DUNBAR
## 2 1
## DUNCAN DUNCANVILLE
## 4 1
## DUNDALK DUNEDIN
## 1 2
## DUNKIRK DUNMORE
## 1 2
## DUNWOODY DURAN
## 1 1
## DURANT DURHAM
## 3 31
## DYERSBURG EAGAN
## 4 3
## EAGLE EAGLE LAKE
## 3 1
## EAGLE MOUNTAIN EAGLE RIVER
## 1 1
## EARLE EASLEY
## 1 1
## EAST BANK EAST BETHEL
## 1 2
## EAST BILLERICA EAST BLOOMFIELD
## 1 1
## EAST BRUNSWICK EAST CHICAGO
## 1 1
## EAST CHINA TOWNSHIP EAST CLEVELAND
## 1 4
## EAST DUBLIN EAST DUNDEE
## 1 1
## EAST GRAND RAPIDS EAST GREENWICH
## 1 1
## EAST HAMPTON EAST HARTFORD
## 1 3
## EAST HAVEN EAST IRVINE
## 3 8
## EAST LYNN EAST MOLINE
## 1 1
## EAST ORANGE EAST PALESTINE
## 5 1
## EAST PALO ALTO EAST PEORIA
## 2 1
## EAST PHARSALIA EAST POINT
## 1 4
## EAST PROVIDENCE EAST RIDGE
## 2 1
## EAST ROCHESTER EAST RUTHERFORD
## 1 2
## EAST SAINT LOUIS EAST SPENCER
## 4 1
## EAST TAWAS EAST WINDSOR
## 1 3
## EAST WINDSOR (HISTORICAL) EASTERN
## 3 1
## EASTLAKE EASTON
## 1 5
## EASTPOINTE EASTPORT
## 3 1
## EATON RAPIDS EATONTON
## 1 1
## EATONTOWN EAU CLAIRE
## 4 2
## EBRO ECHO
## 1 1
## ECORSE ECTOR
## 1 1
## EDDYVILLE EDEN
## 2 2
## EDEN PRAIRIE EDENTON
## 2 1
## EDGEWATER EDGEWOOD
## 6 3
## EDINBURG EDISON
## 4 9
## EDISTO ISLAND EDMOND
## 2 1
## EDMONDS EDWARDSVILLE
## 1 3
## EFFINGHAM EGG HARBOR CITY
## 1 1
## EGG HARBOR TOWNSHIP EL CAJON
## 6 11
## EL CAMPO EL CENTRO
## 1 1
## EL DORADO EL MONTE
## 2 6
## EL PASO EL PRADO
## 54 1
## EL RENO ELBERT
## 4 1
## ELBERTON ELECTRA
## 1 1
## ELGIN ELIZABETH
## 2 10
## ELIZABETH CITY ELIZABETHTON
## 3 1
## ELIZABETHTOWN ELK CITY
## 4 1
## ELK GROVE ELK RIVER
## 5 3
## ELKHART ELKHORN CITY
## 7 1
## ELKINS ELLABELL
## 2 1
## ELLENDALE ELLIJAY
## 1 1
## ELLSWORTH ELMA
## 2 1
## ELMHURST ELMIRA
## 3 2
## ELMWOOD PARK ELOY
## 1 5
## ELSBERRY ELSMERE
## 1 2
## ELWOOD ELYRIA
## 1 1
## EMBUDO EMERSON
## 1 2
## EMORY ENCINITAS
## 1 3
## ENDICOTT ENFIELD
## 2 4
## ENGLAND ENGLEWOOD
## 1 5
## ENID ENNIS
## 2 7
## ENOCH ENTERPRISE
## 1 2
## ENUMCLAW EPSOM
## 1 1
## ERDA ERIE
## 1 6
## ERIN ERWIN
## 1 1
## ESCOBARES ESCONDIDO
## 1 11
## ESPA\xd1OLA ESTER
## 4 1
## ESTES PARK ETNA
## 1 1
## ETNA GREEN EUCLID
## 1 5
## EUFAULA EUGENE
## 2 5
## EULESS EUNICE
## 3 1
## EUREKA EUSTIS
## 7 3
## EVANS EVANS MILLS
## 2 4
## EVANSVILLE EVART
## 12 1
## EVARTS EVELETH
## 1 1
## EVERETT EVERGREEN
## 14 1
## EXCELSIOR SPRINGS EXMORE
## 3 1
## FAIR LAWN FAIR OAKS RANCH
## 3 1
## FAIRBANKS FAIRBORN
## 4 2
## FAIRBURN FAIRFAX
## 1 3
## FAIRFIELD FAIRHAVEN
## 19 1
## FAIRHOPE FAIRMONT
## 1 2
## FAIRVIEW FAIRVIEW HEIGHTS
## 6 1
## FALFURRIAS FALL RIVER
## 1 11
## FALLING SPRING FALLING WATERS
## 1 2
## FALLON FALLSBURG
## 1 3
## FALLSTON FALMOUTH
## 1 2
## FARGO FARIBAULT
## 6 1
## FARMERS BRANCH FARMERSVILLE
## 5 2
## FARMERVILLE FARMINGTON
## 1 13
## FARMINGTON HILLS FARRAGUT
## 4 3
## FAYETTE FAYETTEVILLE
## 1 41
## FEDERAL HEIGHTS FEDERAL WAY
## 1 6
## FENCE LAKE FENTON
## 1 1
## FERGUS FALLS FERGUSON
## 1 3
## FERNANDINA BEACH FERNDALE
## 1 3
## FERRISBURGH FERRON
## 1 1
## FESSENDEN FIFE
## 1 2
## FILER CITY FILLMORE
## 1 2
## FINDLAY FINE
## 2 1
## FIREBRICK FIRESTONE
## 1 1
## FISHERS FISHKILL
## 5 1
## FITCHBURG FITZWILLIAM
## 1 1
## FLAGSTAFF FLANDERS
## 7 1
## FLAT FLEMINGTON
## 1 1
## FLINT FLINT TOWNSHIP
## 27 5
## FLIPPIN FLORAL PARK
## 1 2
## FLORENCE FLORIDA CITY
## 17 1
## FLORISSANT FLOWER MOUND
## 4 3
## FLOWERY BRANCH FOLEY
## 1 1
## FOLSOM FOND DU LAC
## 2 3
## FONTANA FORD RIVER
## 18 1
## FORDLAND FOREST ACRES
## 2 1
## FOREST CITY FOREST GROVE
## 1 1
## FOREST HILL FOREST LAKE
## 3 1
## FOREST PARK FOREST VIEW
## 14 1
## FORESTBURG FORISTELL
## 1 1
## FORNEY FORREST CITY
## 3 2
## FORSYTH FORT ATKINSON
## 1 2
## FORT COLLINS FORT COVINGTON
## 10 1
## FORT DEPOSIT FORT DODGE
## 1 2
## FORT DUCHESNE FORT HALL
## 1 1
## FORT HANCOCK FORT KENT
## 1 1
## FORT LAUDERDALE FORT LEE
## 34 5
## FORT LUPTON FORT MADISON
## 4 1
## FORT MCDOWELL FORT MILL
## 1 1
## FORT MITCHELL FORT MORGAN
## 1 2
## FORT MYERS FORT PIERCE
## 11 10
## FORT SCOTT FORT SMITH
## 1 11
## FORT STEWART FORT THOMAS
## 1 1
## FORT WALTON BEACH FORT WAYNE
## 2 16
## FORT WORTH FORTY FORT
## 106 1
## FOSTER FOSTER CITY
## 2 1
## FOUNTAIN FOUNTAIN HILLS
## 5 1
## FOUNTAIN VALLEY FOWLER
## 6 1
## FOWLERTON FOX
## 1 2
## FRANCESVILLE FRANKFORT
## 1 6
## FRANKLIN FRANKLIN PARK
## 12 3
## FRANKLINVILLE FRASER
## 3 1
## FREDERICK FREDERICKSBURG
## 3 2
## FREDONIA FREEDOM
## 1 1
## FREEHOLD FREEPORT
## 3 3
## FREETOWN FREMONT
## 1 8
## FRENCH CREEK FRENCHBURG
## 2 1
## FRESNO FRIEND
## 65 1
## FRIENDSHIP FRIENDSWOOD
## 1 2
## FRISCO FROSTPROOF
## 5 1
## FRUITLAND FULLERTON
## 1 7
## FULTON FULTONVILLE
## 8 1
## FUQUAY-VARINA GADSDEN
## 1 3
## GAHANNA GAINESBORO
## 3 1
## GAINESVILLE GALENA PARK
## 19 1
## GALESBURG GALLAGHER
## 1 1
## GALLATIN GALLOWAY TOWNSHIP
## 4 7
## GALLUP GALT
## 7 4
## GALVESTON GALWAY
## 14 3
## GARDEN CITY GARDEN GROVE
## 2 10
## GARDENA GARDINER
## 3 3
## GARDNER GARFIELD
## 2 2
## GARLAND GARNER
## 19 3
## GARRETT GARWOOD
## 1 2
## GARY GARYVILLE
## 15 1
## GAS CITY GASPORT
## 1 1
## GASTON GASTONIA
## 2 8
## GATES GATEWAY
## 4 1
## GATLINBURG GAYLORD
## 2 1
## GEARHART GENEVA
## 1 2
## GENOA GENOA CITY
## 1 1
## GENOLA GEORGETOWN
## 1 19
## GEORGIA CENTER GERMANTOWN
## 1 4
## GIG HARBOR GILA BEND
## 3 4
## GILBERT GILBERTON
## 6 1
## GILBERTSVILLE GILBOA
## 1 2
## GILFORD GILLETTE
## 4 2
## GILMER GILMORE
## 1 1
## GILMORE CITY GILROY
## 1 4
## GIRARD GIRDWOOD
## 1 1
## GLADEWATER GLADSTONE
## 1 2
## GLASTONBURY GLEASON
## 2 1
## GLEN BURNIE GLEN COVE
## 1 1
## GLEN ELLYN GLEN JEAN
## 1 1
## GLEN ROSE GLENCOE
## 1 2
## GLENDALE GLENDORA
## 49 3
## GLENS FORK GLENVIEW
## 1 3
## GLOBE GLOSTER
## 3 1
## GLOUCESTER GLOUCESTER CITY
## 1 2
## GODFREY GODLEY
## 3 1
## GOLDEN GOLDEN VALLEY
## 1 7
## GOLDSBORO GOLDSBY
## 2 1
## GOLETA GONZALES
## 3 6
## GOODLETTSVILLE GOODRICH
## 5 1
## GOODYEAR GOOSE CREEK
## 9 4
## GORDONSVILLE GOREE
## 1 1
## GORHAM GOSHEN
## 2 7
## GRAFTON GRAHAM
## 1 3
## GRAHN GRAINFIELD
## 1 2
## GRAMBLING GRANBURY
## 2 2
## GRAND FORKS GRAND ISLE
## 4 1
## GRAND JUNCTION GRAND PRAIRIE
## 5 16
## GRAND RAPIDS GRAND RIDGE
## 14 1
## GRAND TERRACE GRANDVIEW
## 1 2
## GRANDVILLE GRANITE CITY
## 3 2
## GRANTS PASS GRANTSVILLE
## 1 2
## GRANVILLE CENTER GRAPEVINE
## 1 4
## GRASS VALLEY GRAVETTE
## 2 1
## GRAY GRAYSLAKE
## 3 1
## GRAYSON GREAT BARRINGTON
## 1 2
## GREAT BEND GREAT FALLS
## 1 3
## GREAT NECK GREECE
## 1 7
## GREELEY GREEN
## 12 4
## GREEN BAY GREEN FOREST
## 6 1
## GREEN RIVER GREEN SPRING
## 2 1
## GREEN TREE GREEN VALLEY
## 1 1
## GREENACRES CITY GREENBELT
## 3 3
## GREENE GREENE, TOWNSHIP
## 5 2
## GREENEVILLE GREENFIELD
## 1 2
## GREENLAND STATION GREENSBORO
## 1 34
## GREENUP GREENVILLE
## 1 23
## GREENWICH GREENWOOD
## 6 5
## GREENWOOD VILLAGE GREER
## 1 6
## GREGG TOWNSHIP GRENADA
## 1 2
## GRESHAM GRETNA
## 12 3
## GRIDLEY GRIFFIN
## 1 5
## GRIFFITH GROSSE POINTE FARMS
## 1 1
## GROSSE TETE GROTON
## 1 5
## GROVELAND GROVER
## 1 1
## GROVER BEACH GUERNSEY
## 1 1
## GUILDERLAND GULF SHORES
## 1 3
## GULFPORT GUN BARREL CITY
## 12 1
## GUNLOCK GUNTER
## 1 1
## GUNTERSVILLE GURDON
## 2 1
## GURNEE GUTHRIE
## 1 6
## GUYMON GUYTON
## 1 1
## HACKBERRY HACKENSACK
## 1 2
## HADDAM HADDON HEIGHTS
## 2 1
## HADLEY HAGERSTOWN
## 1 2
## HAINES CITY HALEDON
## 6 1
## HALE\x91IWA HALFMOON
## 2 1
## HALLANDALE BEACH HALLTOWN
## 2 1
## HALTOM CITY HAM LAKE
## 5 1
## HAMBURG HAMDEN
## 4 3
## HAMILTON HAMILTON TOWNSHIP
## 6 7
## HAMLET HAMLIN
## 1 1
## HAMMOND HAMMONDVILLE
## 14 7
## HAMMONTON HAMPDEN
## 6 2
## HAMPTON HAMPTON FALLS
## 23 1
## HAMTRAMCK HANAHAN
## 1 1
## HANAPEPE HANGING ROCK
## 1 1
## HANNIBAL HANOVER
## 2 4
## HANOVER PARK HAPPY
## 1 1
## HARDEEVILLE HARFORD
## 1 1
## HARLINGEN HARMONY
## 5 1
## HARPERS FERRY HARPERSVILLE
## 3 1
## HARRIMAN HARRINGTON
## 1 2
## HARRISBURG HARRISON
## 5 5
## HARRISONBURG HARRISONVILLE
## 2 3
## HARRISVILLE HARRODSBURG
## 3 1
## HARTFORD HARTFORD CITY
## 20 1
## HARTLAND HARTLY
## 2 1
## HARTSELLE HARTSVILLE
## 2 1
## HARTWELL HARVARD STATION
## 1 1
## HARVEY HASBROUCK HEIGHTS
## 8 1
## HASTINGS HATLEY
## 5 1
## HATTIESBURG HAVANA
## 7 1
## HAVEN HAVERFORD
## 1 1
## HAVERHILL HAW RIVER
## 3 1
## HAWTHORNE HAYDEN
## 3 1
## HAYNES HAYNESVILLE
## 1 1
## HAYS HAYTI
## 1 1
## HAYWARD HAZARD
## 10 3
## HAZEL CREST HAZELWOOD
## 3 5
## HAZLEHURST HAZLET
## 3 1
## HA\x91IKU HEAD OF WESTPORT
## 1 1
## HEARNE HEATH SPRINGS
## 1 1
## HEBER HEBER CITY
## 1 1
## HEDGESVILLE HEDLEY
## 1 2
## HEGINS HELLERTOWN
## 1 1
## HELOTES HELPER
## 1 1
## HEMET HEMPFIELD TOWNSHIP
## 12 2
## HEMPHILL HEMPSTEAD
## 1 38
## HENAGAR HENDERSON
## 2 13
## HENDERSONVILLE HENNIKER
## 6 1
## HENRIETTA HEPHZIBAH
## 2 2
## HERCULES HEREFORD
## 3 2
## HERINGTON HERKIMER
## 1 3
## HERMISTON HERMITAGE
## 1 1
## HERNANDO HERRIMAN
## 1 2
## HERRIN HESPERIA
## 2 16
## HEWITT HIALEAH
## 1 22
## HIALEAH GARDENS HIBBING
## 1 2
## HICKMAN HICKORY
## 1 2
## HIGH POINT HIGH SPRINGS
## 4 1
## HIGHGATE CENTER HIGHLAND
## 1 9
## HIGHLAND FALLS HIGHLAND HEIGHTS
## 1 2
## HIGHLAND PARK HIGHLAND VILLAGE
## 2 2
## HIGHLANDVILLE HILLSBORO
## 1 12
## HILLSIDE HILLSVILLE
## 3 1
## HILO HILTON HEAD ISLAND
## 2 2
## HINCKLEY HINDSBORO
## 1 1
## HINESBURG HINESVILLE
## 1 5
## HINSDALE HIRAM
## 1 2
## HOBART HOBBS
## 3 1
## HOCKESSIN HOFFMAN ESTATES
## 1 1
## HOGANSVILLE HOLBROOK
## 1 3
## HOLDEN HOLDEN CENTER
## 1 1
## HOLDENVILLE HOLLADAY
## 1 3
## HOLLAND HOLLIS CENTER
## 3 1
## HOLLISTER HOLLISTON
## 4 1
## HOLLY HOLLY HILL
## 1 1
## HOLLY SPRINGS HOLLYWOOD
## 5 26
## HOLLYWOOD PARK HOLMDEL
## 1 2
## HOLTON HOLTSVILLE
## 2 1
## HOLUALOA HOLYOKE
## 1 3
## HOMER GLEN HOMER TOWNSHIP
## 1 2
## HOMESTEAD HOMEWOOD
## 6 3
## HONDO HONOLULU
## 1 8
## HOOD RIVER HOOKSETT
## 1 4
## HOOVER HOPE
## 7 3
## HOPEWELL JUNCTION HOPKINS
## 5 2
## HOPKINSVILLE HOPKINTON
## 2 2
## HOQUIAM HORSE CAVE
## 1 1
## HORSEHEADS HORSESHOE BEND
## 1 1
## HORSHAM HOT SPRINGS
## 1 7
## HOUCK HOUMA
## 1 6
## HOUSTON HOWELL
## 256 2
## HUBER HEIGHTS HUDSON
## 4 5
## HUDSON FALLS HUGOTON
## 1 1
## HULL HUMBLE
## 1 2
## HUMBOLDT HUNTER
## 2 2
## HUNTERSVILLE HUNTINGDON
## 2 1
## HUNTINGTON HUNTINGTON BEACH
## 13 15
## HUNTINGTON PARK HUNTSVILLE
## 4 29
## HURON HURRICANE
## 2 2
## HURST HUTCHINS
## 4 1
## HUTCHINSON HUTTONSVILLE
## 4 1
## HYANNIS HYATTSVILLE
## 1 1
## HYDE PARK HYDEN
## 3 1
## IDABEL IDAHO FALLS
## 2 1
## ILION ILLIOPOLIS
## 1 1
## IMLAY CITY IMMOKALEE
## 1 2
## IMPERIAL BEACH INDEPENDENCE
## 1 22
## INDIAN HILL INDIAN TRAIL
## 1 2
## INDIANAPOLIS INDIANOLA
## 124 1
## INDIO INDUSTRY
## 6 2
## INGLESIDE INGLEWOOD
## 1 10
## INKSTER INTERLAKEN
## 3 1
## INVER GROVE HEIGHTS INVERNESS
## 3 1
## INWOOD IOWA CITY
## 1 1
## IPSWICH IRMO
## 1 1
## IRON MOUNTAIN IRON RIVER
## 1 1
## IRONDEQUOIT IRONTON
## 4 1
## IRVING IRVINGTON
## 13 1
## IRWIN IRWINDALE
## 1 3
## ISANTI ISLAMORADA
## 1 3
## ISLAND FALLS ISLANDIA
## 1 1
## ISLIP ISSAQUAH
## 17 1
## ITHACA IVINS
## 1 1
## JACKSON JACKSONVILLE
## 66 178
## JACKSONVILLE BEACH JAFFREY CENTER
## 2 1
## JAL JAMESTOWN
## 1 5
## JANE JARRELL
## 1 3
## JASPER JAVA CENTER
## 8 1
## JAY JEFFERSON
## 2 5
## JEFFERSON CITY JEFFERSON HILLS
## 3 1
## JEFFERSONVILLE JEMEZ SPRINGS
## 1 1
## JENKINTOWN JENNERS
## 1 1
## JENNINGS JERICHO
## 8 1
## JEROME JERSEY CITY
## 1 9
## JERSEY VILLAGE JOELTON
## 1 2
## JOHNS ISLAND JOHNSON
## 1 1
## JOHNSON CITY JOHNSONVILLE
## 4 2
## JOHNSTON JOHNSTOWN
## 1 4
## JOLIET JONESBORO
## 7 17
## JONESBURG JONESVILLE
## 1 1
## JOPLIN JORDAN
## 14 1
## JOSEPH JOSEPH CITY
## 1 1
## JOSHUA JUNCTION CITY
## 1 3
## JUPITER KAHULUI
## 5 2
## KAILUA KAILUA KONA
## 6 3
## KALAMAZOO KALISPELL
## 8 2
## KANAB KANARRAVILLE
## 2 2
## KANE\x91OHE KANKAKEE
## 4 2
## KANNAPOLIS KANSAS CITY
## 9 114
## KAPOLEI KAPULEI
## 2 1
## KATY KAUFMAN
## 3 1
## KAUKAUNA KAYSVILLE
## 1 3
## KEARNEY KEARNEYSVILLE
## 1 2
## KEARNS KEARNY
## 4 4
## KEA\x91AU KEESEVILLE
## 2 2
## KEIZER KELLER
## 2 1
## KELLYVILLE KELSO
## 1 3
## KEMP KEMPTON
## 2 1
## KENDUSKEAG KENILWORTH
## 1 1
## KENNEBUNK KENNEBUNKPORT
## 1 2
## KENNER KENNESAW
## 7 2
## KENNETT KENNEWICK
## 3 2
## KENOSHA KENOVA
## 8 1
## KENT KENTON
## 11 1
## KENTWOOD KENVIR
## 5 1
## KEO KEOKUK
## 1 2
## KERNERSVILLE KERRVILLE
## 1 2
## KETCHIKAN KETTERING
## 1 1
## KEWANEE KEY BISCAYNE
## 1 1
## KEY LARGO KEY WEST
## 3 1
## KIAWAH ISLAND KIHEI
## 2 2
## KILGORE KILLEEN
## 2 16
## KILLINGLY CENTER KIMBALL
## 1 6
## KIMBERLY KIMMSWICK
## 1 1
## KING KINGMAN
## 1 7
## KINGSBURG KINGSLAND
## 2 2
## KINGSPORT KINGSTON
## 8 6
## KINGSTON SPRINGS KINGSVILLE
## 1 1
## KINMUNDY KINSTON
## 1 2
## KIRBY KIRKLAND
## 1 5
## KIRKSVILLE KIRKWOOD
## 2 2
## KIRTLAND KISSIMMEE
## 1 8
## KITCHEL KITTRELL
## 1 1
## KLAMATH FALLS KNAPP
## 2 1
## KNIGHTDALE KNIGHTSEN
## 1 2
## KNOX KNOXVILLE
## 1 30
## KOHLER KOKOMO
## 1 7
## KOLOA KOPPEL
## 2 1
## KOPPERSTON KURTEN
## 1 1
## KYKOTSMOVI KYLE
## 1 2
## LA CA\xd1ADA FLINTRIDGE LA CROSSE
## 1 1
## LA GRANGE LA HABRA
## 4 1
## LA JOYA LA MARQUE
## 1 2
## LA MESA LA MIRADA
## 5 1
## LA PALMA LA PAZ
## 2 1
## LA PORTE LA PORTE CITY
## 4 1
## LA QUINTA LA VERGNE
## 1 4
## LA VERNE LACEY
## 3 2
## LACKAWANNA LACONIA
## 1 2
## LACY-LAKEVIEW LADSON
## 1 1
## LADUE LADY LAKE
## 1 1
## LAFAYETTE LAGRANGE
## 22 2
## LAGRANGEVILLE LAGUNA
## 2 3
## LAGUNA HILLS LAGUNA NIGUEL
## 4 2
## LAKE BARRINGTON LAKE BUTLER
## 1 1
## LAKE CHARLES LAKE CITY
## 10 5
## LAKE DELTON LAKE ELMO
## 1 1
## LAKE ELSINORE LAKE FOREST
## 3 2
## LAKE GEORGE LAKE GROVE
## 1 1
## LAKE HAVASU CITY LAKE HELEN
## 7 1
## LAKE JACKSON LAKE OSWEGO
## 3 1
## LAKE PARK LAKE PLACID
## 1 3
## LAKE SAINT LOUIS LAKE STEVENS
## 3 1
## LAKE TAPAWINGO LAKE WALES
## 1 5
## LAKE WORTH LAKELAND
## 6 14
## LAKEVIEW LAKEVILLE
## 1 4
## LAKEWOOD LAMAR
## 23 1
## LANCASTER LANDER
## 39 1
## LANDIS LANESBOROUGH
## 1 1
## LANETT LANGLEY PARK
## 3 1
## LANSDOWNE LANSFORD
## 1 1
## LANSING LANTANA
## 15 2
## LAPLACE LARAMIE
## 1 3
## LAREDO LARGO
## 11 13
## LARKSVILLE LAS CRUCES
## 1 9
## LAS VEGAS LASHMEET
## 31 1
## LATHAM LATHROP
## 1 4
## LAUDERDALE LAKES LAUDERDALE-BY-THE-SEA
## 6 1
## LAUDERHILL LAUREL
## 7 3
## LAUREL ACRES LAVALETTE
## 1 3
## LAVEEN LAVERKIN
## 1 1
## LAVONIA LAWA\x91I
## 1 1
## LAWRENCE LAWRENCEBURG
## 14 1
## LAWRENCEVILLE LAWTEY
## 7 1
## LAWTON LAYTON
## 4 2
## LA\x91IE LE CLAIRE
## 1 1
## LE MARS LEAGUE CITY
## 1 5
## LEAKEY LEAMINGTON
## 2 1
## LEANDER LEARNED
## 3 1
## LEAVENWORTH LEBANON
## 2 19
## LEBO LEE
## 1 1
## LEEDS LEES SUMMIT
## 1 4
## LEESBURG LEESVILLE
## 5 1
## LEGGETT LEHI
## 1 1
## LEHIGH ACRES LEICESTER
## 1 3
## LELAND LEMON GROVE
## 3 5
## LEMONT LEMOORE
## 1 1
## LEMOYNE LENEXA
## 1 2
## LENOIR LENOIR CITY
## 1 1
## LEOMINSTER LEON
## 3 1
## LEON VALLEY LEONA
## 1 1
## LEONARD LEVANT
## 1 1
## LEVELLAND LEVERETT
## 1 1
## LEWISBURG LEWISTON
## 3 9
## LEWISTOWN LEWISVILLE
## 2 11
## LEXINGTON LEXINGTON-FAYETTE
## 4 25
## LIBERAL LIBERTY
## 1 8
## LIBERTY HILL LIBERTYVILLE
## 1 2
## LIGHTHOUSE POINT LIHU\x91E
## 3 2
## LILBURN LILLINGTON
## 3 2
## LIMA LIMINGTON
## 2 1
## LINCOLN LINCOLN CITY
## 18 2
## LINCOLN PARK LINCOLNTON
## 1 2
## LINCOLNVILLE LINDEN
## 1 1
## LINDENHURST LINDSTROM
## 1 1
## LINN CREEK LINO LAKES
## 2 2
## LINWOOD LISLE
## 1 1
## LITCHFIELD LITCHFIELD PARK
## 2 2
## LITHONIA LITTLE BIRCH
## 3 1
## LITTLE ELM LITTLE FALLS
## 1 3
## LITTLE ROCK LITTLE VALLEY
## 40 2
## LITTLEFIELD LITTLETON
## 3 4
## LITTLEVILLE LIVE OAK
## 1 2
## LIVERMORE LIVERPOOL
## 4 2
## LIVINGSTON LIVONIA
## 3 7
## LIZELLA LIZEMORES
## 2 2
## LLOYD LOCKESBURG
## 2 1
## LOCKHART LOCKPORT
## 5 12
## LOCUST GROVE LODI
## 1 6
## LOGAN LOGANSPORT
## 12 3
## LOGANVILLE LOMBARD
## 2 3
## LOMITA LONDON GROVE
## 1 1
## LONDONDERRY LONE JACK
## 2 1
## LONG BEACH LONG GROVE
## 31 1
## LONGMONT LONGVIEW
## 5 13
## LONGWOOD LONOKE
## 2 1
## LOOKOUT LOOMIS
## 1 1
## LORAIN LORANGER
## 4 1
## LOS ALAMOS LOS ALTOS
## 1 1
## LOS ALTOS HILLS LOS ANGELES
## 2 268
## LOS BANOS LOS INDIOS
## 1 1
## LOS LUNAS LOUISVILLE
## 5 109
## LOVELAND LOVES PARK
## 6 2
## LOVINGTON LOWELL
## 4 11
## LOWER BELLE LOWVILLE
## 1 1
## LOXAHATCHEE GROVES LOXLEY
## 1 1
## LOYALL LUBBOCK
## 1 22
## LUCAS LUCEDALE
## 1 1
## LUDOWICI LUFKIN
## 2 3
## LUKACHUKAI LULA
## 1 1
## LULING LUMBERTON
## 1 9
## LUMPKIN LUPTON
## 1 2
## LUTCHER LUTHER
## 1 1
## LYMAN LYNBROOK
## 3 1
## LYNCHBURG LYNDHURST
## 6 1
## LYNDON LYNDONVILLE
## 1 1
## LYNN LYNNWOOD
## 5 3
## LYNWOOD LYONS
## 4 4
## MABANK MABEL
## 1 1
## MACHESNEY PARK MACOMB, TOWNSHIP
## 1 3
## MACON MADAWASKA
## 30 1
## MADEIRA BEACH MADERA
## 1 3
## MADILL MADISON
## 1 26
## MADISON HEIGHTS MAGEE
## 3 1
## MAGNA MAGNOLIA
## 4 5
## MAHOMET MAITLAND
## 1 1
## MALDEN MALIBU
## 3 5
## MALLIE MALTA
## 1 2
## MALVERN MANALAPAN
## 1 3
## MANASSAS MANCHESTER
## 1 18
## MANCHESTER TOWNSHIP MANDAN
## 2 2
## MANDEVILLE MANHATTAN
## 1 1
## MANISTEE MANITOWOC
## 1 3
## MANNINGTON MANOR
## 1 2
## MANSFIELD MANSFIELD CENTER
## 4 2
## MANSURA MANTECA
## 1 9
## MANTI MANTUA
## 1 1
## MANY FARMS MAPLE SHADE
## 1 2
## MAPLE VALLEY MAPLESVILLE
## 1 1
## MAPLETON MAPLEWOOD
## 3 5
## MAQUOKETA MARANA
## 1 4
## MARATHON MARBLE CANYON
## 1 1
## MARBLETOWN MARCO
## 1 2
## MARCY MARENGO
## 1 1
## MARIANNA MARIETTA
## 1 19
## MARINA MARION
## 2 6
## MARKED TREE MARKHAM
## 1 3
## MARKSVILLE MARLBORO
## 1 3
## MARLBOROUGH MARLIN
## 1 1
## MARLOW MAROA
## 1 1
## MARQUEZ MARSHALL
## 1 5
## MARSHALLTOWN MARSHFIELD
## 2 2
## MARTIN MARTINEZ
## 4 1
## MARTINSBURG MARTINSVILLE
## 9 6
## MARYLAND HEIGHTS MARYSVILLE
## 2 6
## MARYVILLE MASCOTTE
## 4 1
## MASHPEE MASON
## 1 1
## MASONTOWN MASSAPEQUA PARK
## 1 1
## MASSILLON MATADOR
## 3 1
## MATTESON MATTHEWS
## 2 1
## MATTOON MAUCKPORT
## 2 1
## MAUI ISLAND MAULDIN
## 1 1
## MAUMEE MAURICETOWN
## 2 4
## MAURICEVILLE MAXTON
## 1 1
## MAYER MAYFIELD
## 1 3
## MAYFLOWER MAYKING
## 1 1
## MAYNARDVILLE MAYSVILLE
## 4 2
## MAYWOOD MA\x91ALAEA
## 4 2
## MA\x91ILI MC DONOUGH
## 2 1
## MCALLEN MCCARR
## 6 1
## MCCAYSVILLE MCCLELLAND
## 1 1
## MCCOMB MCDANIELS
## 1 1
## MCDONOUGH MCGEHEE
## 3 1
## MCINTYRE MCKEES ROCKS
## 2 1
## MCKEESPORT MCKENZIE
## 2 1
## MCKINNEY MCLENDON-CHISHOLM
## 11 1
## MCNEAL MEAD
## 1 1
## MEADOW BRIDGE MEDANALES
## 1 1
## MEDFORD MEDLEY
## 7 1
## MEDORA MEDWAY
## 1 1
## MEGGETT MELBOURNE
## 3 11
## MELISSA MELROSE HIGHLANDS
## 2 3
## MELROSE PARK MELVILLE
## 1 1
## MELVIN MEMPHIS
## 1 208
## MENANDS MENDENHALL
## 2 2
## MENDOTA MENDOTA HEIGHTS
## 1 1
## MENIFEE MENLO PARK
## 7 1
## MENOMINEE MENTOR
## 2 2
## MERCED MERCEDES
## 8 1
## MERIDEN MERIDIAN
## 11 9
## MERRIAM MERRILLVILLE
## 1 4
## MERRIMACK MERRITT ISLAND
## 3 1
## MESA MESQUITE
## 46 16
## META METHUEN
## 1 3
## METROPOLIS METUCHEN
## 2 1
## MEXICAN SPRINGS MEXICO
## 1 1
## MIAMI MIAMI BEACH
## 58 5
## MIAMI GARDENS MIAMI SHORES
## 16 3
## MIAMI SPRINGS MIAMISBURG
## 1 1
## MICHIGAN CITY MIDDLE GROVE
## 4 1
## MIDDLE ISLAND MIDDLE VILLAGE
## 1 77
## MIDDLEBORO MIDDLEBURG
## 2 1
## MIDDLEBURG HEIGHTS MIDDLEBURY
## 1 4
## MIDDLESEX MIDDLETON
## 1 1
## MIDDLETOWN MIDFIELD
## 10 1
## MIDLAND MIDLOTHIAN
## 15 7
## MIDVALE MIDVILLE
## 2 1
## MIDWAY MIDWEST CITY
## 3 2
## MIKADO MILAN
## 1 2
## MILFORD MILILANI TOWN
## 5 2
## MILLBRAE MILLBROOK
## 1 1
## MILLBURY MILLEDGEVILLE
## 3 3
## MILLERS CREEK MILLERSBURG
## 1 2
## MILLERTON MILLIKEN
## 1 1
## MILLINGTON MILLIS
## 2 1
## MILLSBORO MILLTOWN
## 2 1
## MILLVILLE MILLWOOD
## 4 1
## MILNER MILPITAS
## 1 1
## MILTON MILTON-FREEWATER
## 13 2
## MILWAUKEE MILWAUKIE
## 77 1
## MIMS MINCO
## 1 1
## MINDEN MINE HILL
## 1 1
## MINEOLA MINERAL BLUFF
## 1 1
## MINERAL POINT MINERAL WELLS
## 1 4
## MINNEAPOLIS MINNETONKA MILLS
## 16 1
## MINOOKA MINOT
## 1 2
## MINT HILL MIRAMAR
## 2 8
## MISHAWAKA MISSION
## 6 6
## MISSION HILLS MISSION VIEJO
## 1 5
## MISSOULA MISSOURI CITY
## 3 2
## MITCHELL MOAB
## 1 3
## MOBERLY MOBILE
## 1 26
## MODESTO MOHAVE VALLEY
## 15 2
## MOHAWK MOLINE
## 1 5
## MOLINE ACRES MONA
## 4 3
## MONCKS CORNER MONEE
## 1 1
## MONESSEN MONETT
## 1 1
## MONONA MONONGAHELA
## 1 1
## MONROE MONROE CITY
## 22 2
## MONROE TOWNSHIP MONROVIA
## 1 1
## MONSEY MONTCALM
## 1 1
## MONTCLAIR MONTEBELLO
## 4 2
## MONTEREY MONTEREY PARK
## 1 4
## MONTEZUMA MONTGOMERY
## 2 25
## MONTICELLO MONTPELIER
## 9 1
## MONTROSE MONTVALE
## 2 1
## MONTVILLE MOORE
## 1 7
## MOORELAND MOORESTOWN
## 1 1
## MOORESVILLE MOORHEAD
## 4 2
## MOORPARK MOOSE PASS
## 3 1
## MOOSIC MORA
## 2 1
## MORAINE MOREHEAD CITY
## 1 1
## MORENO VALLEY MORGAN
## 14 3
## MORGAN HILL MORGANTON
## 5 2
## MORGANTOWN MORIARTY
## 7 2
## MORMON LAKE MORRILTON
## 1 1
## MORRIS MORRISON
## 1 1
## MORRISTOWN MORRISVILLE
## 6 1
## MORROW MORTON
## 2 2
## MORTON GROVE MOSCOW MILLS
## 1 1
## MOSHEIM MOSS POINT
## 1 4
## MOULTON MOULTRIE
## 2 1
## MOUND BAYOU MOUNDS
## 1 1
## MOUNDS VIEW MOUNDSVILLE
## 1 1
## MOUNT AIRY MOUNT CARMEL
## 2 2
## MOUNT CLEMENS MOUNT DORA
## 1 2
## MOUNT HOLLY MOUNT JULIET
## 3 4
## MOUNT LAUREL MOUNT MORRIS
## 4 2
## MOUNT OLIVE MOUNT ORAB
## 1 1
## MOUNT PLEASANT MOUNT PROSPECT
## 12 1
## MOUNT PULASKI MOUNT STORM
## 1 1
## MOUNT VERNON MOUNTAIN BROOK
## 7 2
## MOUNTAIN CITY MOUNTAIN GREEN
## 1 2
## MOUNTAIN HOME MOUNTAIN LAKES
## 2 2
## MOUNTAIN VIEW MOUNTAIN VILLAGE
## 5 1
## MOUNTAINSIDE MOUNTLAKE TERRACE
## 1 2
## MOUNTVILLE MOXEE CITY
## 1 1
## MULBERRY MULDRAUGH
## 2 1
## MULESHOE MULLINS
## 1 2
## MUNCIE MUNDELEIN
## 7 2
## MUNDS PARK MUNFORDVILLE
## 1 1
## MUNSTER MURFREESBORO
## 1 9
## MURRAY MURRIETA
## 2 3
## MURRYSVILLE MUSCATINE
## 3 1
## MUSKEGON MUSKEGON HEIGHTS
## 5 2
## MUSKOGEE MUSTANG
## 3 1
## MYRTLE BEACH MYRTLE CREEK
## 5 1
## MYTON NACHES
## 1 1
## NACOGDOCHES NAHANT
## 2 1
## NAMPA NANAKULI
## 4 3
## NANTUCKET NAPA
## 1 6
## NAPERVILLE NAPLES
## 5 6
## NAPPANEE NARANJA
## 1 2
## NARRAGANSETT PIER NARROWS
## 1 1
## NASHUA NASHVILLE
## 3 98
## NATCHEZ NATCHITOCHES
## 2 3
## NATIONAL CITY NAUVOO
## 7 1
## NEDERLAND NEEDLES
## 1 1
## NEENAH NEOLA
## 1 1
## NEON NEOSHO
## 1 1
## NEPHI NEPTUNE CITY
## 4 2
## NESQUEHONING NEW ALBANY
## 1 2
## NEW BALTIMORE NEW BEDFORD
## 1 6
## NEW BERLIN NEW BERN
## 2 3
## NEW BOSTON NEW BRAUNFELS
## 1 9
## NEW BRITAIN NEW BRUNSWICK
## 6 8
## NEW CANEY NEW CASTLE
## 1 16
## NEW CITY NEW CREEK
## 3 1
## NEW GLOUCESTER NEW HARTFORD
## 1 1
## NEW HAVEN NEW HOLLAND
## 19 2
## NEW HOPE NEW HYDE PARK
## 3 7
## NEW IBERIA NEW IPSWICH
## 2 2
## NEW KENSINGTON NEW LIMERICK
## 1 2
## NEW LONDON NEW MANCHESTER
## 2 1
## NEW MARKET NEW MARTINSVILLE
## 2 2
## NEW MELLE NEW MILFORD
## 1 3
## NEW MILTON NEW ORLEANS
## 1 49
## NEW PALTZ NEW PHILADELPHIA
## 1 1
## NEW PORT RICHEY NEW PROVIDENCE
## 3 1
## NEW RICHMOND NEW RIVER
## 1 1
## NEW ROCHELLE NEW SHOREHAM
## 1 2
## NEW SMYRNA BEACH NEW WAVERLY
## 9 2
## NEW WINDSOR NEW YORK
## 1 29
## NEW YORK CITY NEWARK
## 117 41
## NEWARK VALLEY NEWBERRY
## 1 1
## NEWBURG NEWBURGH
## 1 9
## NEWBURY OLD TOWN NEWBURYPORT
## 1 1
## NEWCASTLE NEWCOMB
## 5 1
## NEWELL NEWINGTON
## 1 1
## NEWNAN NEWPORT
## 3 12
## NEWPORT BEACH NEWPORT NEWS
## 9 21
## NEWTON NEWTOWN
## 8 2
## NEYLANDVILLE NIAGARA
## 1 1
## NIAGARA FALLS NICHOLASVILLE
## 5 3
## NICHOLLS NILES
## 1 3
## NISKAYUNA NIXA
## 1 1
## NOBLESVILLE NOGALES
## 5 2
## NOLANVILLE NORCO
## 2 1
## NORCROSS NORFOLK
## 2 23
## NORMAL NORMAN
## 1 12
## NORMAN PARK NORRIDGEWOCK
## 1 1
## NORRISTOWN NORTH ADAMS
## 1 2
## NORTH ANDOVER CENTER NORTH ATTLEBORO
## 3 3
## NORTH AUGUSTA NORTH BERGEN
## 3 2
## NORTH BETHESDA NORTH BRANFORD
## 1 2
## NORTH BRUNSWICK NORTH BUFFALO
## 4 1
## NORTH CANAAN NORTH CANTON
## 1 1
## NORTH CHARLESTON NORTH CHICAGO
## 17 1
## NORTH COLLEGE HILL NORTH COLLINS
## 2 1
## NORTH CORBIN NORTH COVENTRY
## 1 2
## NORTH DARTMOUTH NORTH EAST
## 1 1
## NORTH HAMPTON NORTH HAVEN
## 1 2
## NORTH HILLS NORTH JUDSON
## 1 1
## NORTH LAS VEGAS NORTH LAUDERDALE
## 7 3
## NORTH LITTLE ROCK NORTH MIAMI
## 7 8
## NORTH MIAMI BEACH NORTH MYRTLE BEACH
## 2 3
## NORTH OLMSTED NORTH PALM BEACH
## 3 2
## NORTH PALM SPRINGS NORTH PLAINFIELD
## 5 1
## NORTH PLAINS NORTH PLATTE
## 1 2
## NORTH POLE NORTH PORT
## 1 3
## NORTH POTOMAC NORTH READING
## 1 1
## NORTH RICHLAND HILLS NORTH ROYALTON
## 1 4
## NORTH SMITHFIELD NORTH STONINGTON
## 1 1
## NORTH TONAWANDA NORTH VERNON
## 1 1
## NORTH ZULCH NORTHAMPTON
## 1 1
## NORTHFIELD NORTHFIELD TOWNSHIP
## 2 1
## NORTHGLENN NORTHLAKE
## 1 3
## NORTHPORT NORTON
## 5 3
## NORTON SHORES NORTONVILLE
## 1 1
## NORVELL NORWALK
## 1 11
## NORWICH NORWOOD
## 6 3
## NOT APPLICABLE Not Reported
## 17146 531
## NOTTAWA NOTUS
## 1 1
## NOVATO NOVI
## 2 1
## NUTLEY NUTRIOSO
## 1 1
## NYACK O'FALLON
## 1 3
## O'NEILL OAK CREEK
## 1 1
## OAK FOREST OAK GROVE
## 1 1
## OAK HARBOR OAK HILL
## 1 1
## OAK LAWN OAK PARK
## 2 2
## OAK POINT OAK RIDGE
## 1 3
## OAK RIDGE NORTH OAKBROOK TERRACE
## 1 1
## OAKDALE OAKGROVE
## 3 1
## OAKLAND OAKLAND PARK
## 31 7
## OAKWOOD OBETZ
## 1 1
## OCALA OCEAN CITY
## 16 1
## OCEANSIDE OCOEE
## 13 4
## ODESSA ODIN
## 28 1
## OGDEN OGLESBY
## 14 1
## OGLETHORPE OIL CITY
## 1 1
## OJAI OKAWVILLE
## 1 1
## OKLAHOMA CITY OKMULGEE
## 79 2
## OLATHE OLD BRIDGE
## 4 7
## OLD COVE OLD FIELDS
## 1 1
## OLD FORGE OLD LYME
## 2 1
## OLD ORCHARD BEACH OLD STANTON
## 1 1
## OLD VALDEZ OLD WESTBURY
## 1 1
## OLDTOWN OLEAN
## 1 1
## OLIVE BRANCH OLIVE HILL
## 6 1
## OLIVEBRIDGE OLIVER SPRINGS
## 1 1
## OLMSTED FALLS OLNEY
## 1 1
## OLYMPIA OLYMPIA FIELDS
## 1 3
## OMAHA OMAK
## 38 1
## OMER ONALASKA
## 1 1
## ONEIDA ONEONTA
## 2 1
## ONONDAGA HILL ONTARIO
## 1 18
## OOLITIC OPA-LOCKA
## 2 2
## OPELIKA OPELOUSAS
## 5 2
## ORACLE ORANGE
## 1 18
## ORANGE BEACH ORANGE CITY
## 2 7
## ORCHARD PARK OREGON
## 1 4
## OREM ORIENT
## 7 1
## ORINDA ORLAND
## 3 1
## ORLAND PARK ORLANDO
## 2 42
## ORMOND BEACH ORONO
## 7 1
## ORONOGO OROVILLE
## 1 5
## ORRINGTON ORRVILLE
## 1 1
## OSBORNE OSCEOLA
## 1 4
## OSCEOLA MILLS OSHKOSH
## 1 2
## OSHTEMO OSKALOOSA
## 2 1
## OSSIPEE OTHELLO
## 1 1
## Other OTSEGO
## 193 1
## OTTAWA OTTAWA HILLS
## 5 1
## OTTER CREEK OTTUMWA
## 2 1
## OVERLAND OVERLAND PARK
## 2 7
## OVID OVIEDO
## 1 1
## OWASSO OWATONNA
## 2 2
## OWENS CROSS ROADS OWENSBORO
## 1 4
## OXFORD OXNARD
## 12 5
## OYSTER BAY OZARK
## 18 8
## OZONA PACIFIC
## 1 2
## PACIFICA PADUCAH
## 3 3
## PAGELAND PAHOA
## 1 1
## PAINCOURTVILLE PAINTED POST
## 1 1
## PAINTSVILLE PALATINE
## 1 2
## PALATKA PALESTINE
## 2 3
## PALM BAY PALM BEACH
## 6 1
## PALM BEACH GARDENS PALM COAST
## 5 8
## PALM DESERT PALM SPRINGS
## 1 5
## PALMDALE PALMER
## 24 7
## PALMETTO BAY PALMYRA
## 1 8
## PALO ALTO PALOS HEIGHTS
## 4 1
## PANAMA CITY PANAMA CITY BEACH
## 4 5
## PANORAMA PARK PAOLA
## 1 1
## PARADISE PARAGONAH
## 4 1
## PARAGOULD PARAMOUNT
## 1 3
## PARAMUS PARIS
## 4 3
## PARISH PARK CITY
## 1 3
## PARKER PARKERSBURG
## 11 7
## PARMA PARMA HEIGHTS
## 1 2
## PAROWAN PARRISH
## 1 1
## PARSIPPANY PARSONS
## 1 2
## PARSONSFIELD PASADENA
## 1 19
## PASCAGOULA PASCO
## 5 3
## PASO ROBLES PASS CHRISTIAN
## 3 3
## PASSAIC PATASKALA
## 1 1
## PATCHOGUE PATERSON
## 1 7
## PATTERSON PAULDEN
## 5 1
## PAULDING PAW PAW
## 1 1
## PAWTUCKET PAYETTE
## 6 1
## PAYSON PEA RIDGE
## 7 1
## PEACHTREE CITY PEARL
## 1 2
## PEARL CITY PEARSALL
## 1 2
## PEASTER PECK
## 1 1
## PECOS PECULIAR
## 2 1
## PEEKSKILL PEETZ
## 1 1
## PEGRAM PEKIN
## 1 1
## PELHAM PELL CITY
## 5 3
## PEMBERTON PEMBROKE
## 1 3
## PEMBROKE PINES PENDLETON
## 12 6
## PENFIELD PENN YAN
## 1 1
## PENNDEL PENNS GROVE
## 1 1
## PENNSAUKEN PENNSVILLE
## 1 2
## PENSACOLA PEORIA
## 2 24
## PEOTONE PERALTA
## 1 1
## PERIDOT PERRIS
## 2 12
## PERRY PERTH AMBOY
## 2 1
## PERU PETALUMA
## 1 2
## PETERBORO PETERSBURG
## 1 9
## PEVELY PEWAUKEE
## 2 2
## PEWEE VALLEY PE\xd1ASCO
## 1 1
## PFLUGERVILLE PHARR
## 2 2
## PHENIX CITY PHILADELPHIA
## 7 154
## PHOENIX PICAYUNE
## 211 2
## PICKENS PICKERINGTON
## 1 1
## PICO RIVERA PIEDMONT
## 3 3
## PIERCETON PIERRE
## 1 1
## PIERRON PIERSON
## 1 1
## PIGEON FORGE PIKEVILLE
## 1 2
## PILAR PIMA
## 3 1
## PINE BLUFF PINE LAWN
## 5 2
## PINEHURST PINELLAS PARK
## 1 8
## PINETOP PINETOP-LAKESIDE
## 1 1
## PINEVILLE PINEY FLATS
## 3 1
## PINSONFORK PIPPA PASSES
## 1 1
## PISCATAWAY PITCAIRN
## 5 1
## Pittman Center PITTSBURG
## 1 8
## PITTSBURGH PITTSFIELD
## 20 7
## PITTSFORD PITTSTON
## 1 1
## PLACENTIA PLACERVILLE
## 1 1
## PLACITAS PLAIN DEALING
## 1 1
## PLAINFIELD PLAINSBORO
## 6 2
## PLAINVIEW PLAINWELL
## 2 1
## PLANO PLANT CITY
## 16 6
## PLANTATION PLAQUEMINE
## 10 2
## PLATTE CITY PLATTEVILLE
## 1 4
## PLATTSBURGH PLEASANT GROVE
## 1 1
## PLEASANT HILL PLEASANT PRAIRIE
## 4 2
## PLEASANT RIDGE PLEASANT VALLEY
## 2 2
## PLEASANTON PLEASANTVILLE
## 3 6
## PLUM PLYMOUTH
## 1 4
## POCAHONTAS POCATELLO
## 1 1
## POINT PLEASANT POLACCA
## 1 1
## POLKTON POMFRET
## 1 2
## POMONA POMPANO BEACH
## 16 27
## PONCA CITY PONETO
## 1 1
## PONTIAC PONTOON BEACH
## 8 2
## POOLER POPLAR BLUFF
## 3 3
## POQUOSON PORT ALLEN
## 1 1
## PORT ARTHUR PORT EDWARDS
## 8 1
## PORT HURON PORT JERVIS
## 2 1
## PORT LAVACA PORT NECHES
## 1 2
## PORT NIKISKI PORT ORANGE
## 2 4
## PORT REPUBLIC PORT RICHEY
## 1 1
## PORT ROYAL PORT SAINT JOE
## 2 1
## PORT SAINT LUCIE PORT WENTWORTH
## 13 2
## PORTAGE PORTALES
## 3 1
## PORTER PORTERFIELD
## 2 1
## PORTERVILLE PORTIA
## 4 1
## PORTLAND PORTSMOUTH
## 58 4
## POSEN POST FALLS
## 1 2
## POTEAU POTOMAC
## 1 1
## POTSDAM POTTSTOWN
## 1 3
## POTTSVILLE POUGHKEEPSIE
## 1 3
## POUND RIDGE POWDER SPRINGS
## 1 3
## POWELL POWERS
## 3 1
## PRAIRIEVILLE PRATT
## 1 1
## PRATTSBURG PRATTSVILLE
## 1 2
## PRATTVILLE PREBLE
## 2 1
## PREMIER PRESCOTT
## 1 6
## PRESCOTT VALLEY PRESTON
## 2 1
## PRESTONSBURG PRICE
## 4 3
## PRICEVILLE PRICHARD
## 1 7
## PRIMGHAR PRINCETON
## 1 10
## PRINCEVILLE PROCTOR
## 1 2
## PROSPECT PROSPER
## 2 1
## PROVIDENCE PROVO
## 13 5
## PRYOR PUEBLO
## 1 13
## PUEBLO WEST PUKALANI
## 1 1
## PULASKI PULLMAN
## 1 1
## PUNTA GORDA PURCELL
## 1 3
## PURDY PUTNAM
## 2 2
## PUTNEY PUYALLUP
## 1 4
## QUARTZSITE QUEEN CITY
## 4 1
## QUEEN CREEK QUEENSBURY
## 4 1
## QUEMADO QUINCY
## 1 16
## QUINLAN RACINE
## 1 9
## RADCLIFF RAINBOW CITY
## 2 1
## RAINELLE RAINIER
## 1 1
## RAINSVILLE RALEIGH
## 2 18
## RALLS RAMAGE
## 1 1
## RAMAPO RAMSEY
## 2 2
## RANCHESTER RANCHO CORDOVA
## 1 3
## RANCHO CUCAMONGA RANCHO SANTA MARGARITA
## 16 1
## RANCHOS DE TAOS RANDLETT
## 1 1
## RANDOLPH RANSON
## 9 2
## RAPID CITY RAVENEL
## 7 1
## RAVENNA RAVENSWOOD
## 1 2
## RAWLINS RAY
## 2 1
## RAY TOWNSHIP RAYMOND
## 1 1
## RAYNE RAYNHAM CENTER
## 2 4
## RAYTOWN RAYVILLE
## 1 2
## RAYWICK READER
## 1 1
## READING READINGTON
## 6 1
## RED BANK RED BLUFF
## 1 2
## RED HOOK RED HOUSE
## 1 1
## RED OAK RED RIVER
## 3 1
## RED SPRINGS REDBUSH
## 1 1
## REDDING REDFORD TOWNSHIP
## 12 5
## REDLANDS REDMOND
## 10 2
## REDONDO BEACH REDWOOD CITY
## 1 2
## REEDLEY REHOBOTH
## 2 1
## REIDSVILLE REMSEN
## 2 1
## RENO RENSSELAER
## 24 1
## RENTON REPUBLIC
## 4 2
## RHINEBECK RIALTO
## 1 15
## RICE RICEBORO
## 1 1
## RICHARDS RICHARDSON
## 1 9
## RICHFIELD RICHFIELD SPRINGS
## 4 1
## RICHFORD RICHLAND
## 1 2
## RICHMOND RICHMOND HEIGHTS
## 51 2
## RICHMOND HILL RICHTON PARK
## 3 1
## RICHWOOD RIDGE
## 2 1
## RIDGECREST RIDGEFIELD
## 1 4
## RIDGELAND RIDLEY PARK
## 5 1
## RIFLE RIGA
## 1 1
## RIGBY RINCONADA
## 1 1
## RINDGE RINEYVILLE
## 1 1
## RINGGOLD RIO GRANDE CITY
## 2 1
## RIO RANCHO RIPLEY
## 3 2
## RIPON RIVER EDGE
## 1 1
## RIVER FOREST RIVER OAKS
## 1 1
## RIVER RIDGE RIVERBANK
## 1 1
## RIVERDALE RIVERDALE PARK
## 8 1
## RIVERHEAD RIVERSIDE
## 4 39
## RIVIERA BEACH ROANOKE
## 4 15
## ROANOKE RAPIDS ROBBINSVILLE
## 2 1
## ROBINS ROBINSON
## 1 1
## ROBSTOWN ROCHESTER
## 1 27
## ROCK HILL ROCK ISLAND
## 2 2
## ROCK SPRINGS ROCKFORD
## 2 13
## ROCKINGHAM ROCKLAND
## 2 1
## ROCKMART ROCKWALL
## 2 4
## ROCKWOOD ROCKY HILL
## 2 2
## ROCKY MOUNT ROGERS
## 8 8
## ROGERSVILLE ROLESVILLE
## 1 1
## ROLLING MEADOWS ROME
## 1 4
## ROME CITY ROMEOVILLE
## 1 3
## ROMNEY ROMULUS
## 1 4
## RONCEVERTE ROSCOE
## 2 1
## ROSEBURG ROSEDALE
## 3 1
## ROSELAND ROSELAWN
## 1 1
## ROSELLE ROSELLE PARK
## 2 1
## ROSEMEAD ROSEMONT
## 1 1
## ROSEMOUNT ROSENBERG
## 1 5
## ROSENDALE ROSEPINE
## 1 1
## ROSEVILLE ROSLYN ESTATES
## 11 1
## ROSWELL ROTTERDAM
## 8 4
## ROUND LAKE ROUND ROCK
## 2 7
## ROWLETT ROY
## 2 2
## ROYAL OAK ROYAL PALM BEACH
## 1 1
## ROYALTON ROYALTON CENTER
## 2 2
## RUDYARD RUMFORD
## 1 1
## RUNAWAY BAY RUNNEMEDE
## 1 1
## RUPERT RUSH
## 1 1
## RUSHSYLVANIA RUSSELL
## 1 2
## RUSSELL SPRINGS RUSSELLS MILLS
## 2 2
## RUSSELLVILLE RUTH
## 7 1
## RUTHERFORD RUTLAND
## 2 2
## RUTLEDGE RYAN
## 3 1
## SABATTUS SABULA
## 1 1
## SACATON SACO
## 4 1
## SACRAMENTO SAGINAW
## 43 6
## SAGOLA SAHUARITA
## 1 4
## SAINT ALBANS SAINT AMANT
## 1 1
## SAINT AUGUSTINE SAINT BERNARD
## 3 2
## SAINT CHARLES SAINT CLAIR
## 6 3
## SAINT CLAIR SHORES SAINT CLOUD
## 3 5
## SAINT FRANCIS SAINT FRANCISVILLE
## 1 1
## SAINT GEORGE SAINT JOHN
## 9 2
## SAINT JOHNS SAINT JOSEPH
## 1 6
## SAINT LOUIS SAINT LOUIS PARK
## 76 1
## SAINT MARTINS SAINT MARYS
## 1 1
## SAINT MICHAEL SAINT PAUL
## 1 13
## SAINT PETER SAINT PETERS
## 1 7
## SAINT PETERSBURG SAINT ROBERT
## 31 1
## SALADO SALEM
## 1 18
## SALINA SALINAS
## 6 7
## SALISBURY SALOME
## 17 3
## SALT LAKE CITY SALTILLO
## 24 2
## SAN ANGELO SAN ANTONIO
## 9 147
## SAN BENITO SAN BERNARDINO
## 2 38
## SAN BRUNO SAN CLEMENTE
## 1 3
## SAN DIEGO SAN DIMAS
## 95 1
## SAN FELIPE SAN FIDEL
## 1 1
## SAN FRANCISCO SAN GABRIEL
## 29 2
## SAN JACINTO SAN JOSE
## 9 55
## SAN JUAN SAN JUAN CAPISTRANO
## 2 2
## SAN LEANDRO SAN LUIS OBISPO
## 8 4
## SAN MANUEL SAN MARCOS
## 1 14
## SAN MATEO SAN PABLO
## 6 4
## SAN RAMON SAN SIMON
## 2 2
## SAN YSIDRO SANBORN
## 3 1
## SANBORNTON SAND SPRINGS
## 2 2
## SANDERS SANDIA PARK
## 1 1
## SANDUSKY SANDY
## 1 1
## SANDY CITY SANDY SPRINGS
## 1 9
## SANDYVILLE SANFORD
## 1 10
## SANGER SANTA ANA
## 3 21
## SANTA ANA PUEBLO SANTA BARBARA
## 2 1
## SANTA CLARA SANTA CLARITA
## 5 6
## SANTA CRUZ SANTA FE
## 5 13
## SANTA FE SPRINGS SANTA MARIA
## 4 2
## SANTA PAULA SANTA ROSA
## 1 6
## SAPULPA SARALAND
## 2 1
## SARANAC LAKE SARASOTA
## 1 7
## SARATOGA SARATOGA SPRINGS
## 1 2
## SARDINIA SATSUMA
## 1 1
## SAUGERTIES SAUGET
## 4 4
## SAUGUS SAUK VILLAGE
## 1 2
## SAUTEE NACOOCHEE SAVAGE
## 1 1
## SAVANNA SAVANNAH
## 1 15
## SAYRE SAYREVILLE
## 1 3
## SCARBOROUGH SCARBRO
## 3 2
## SCARSDALE SCHAGHTICOKE
## 1 2
## SCHAUMBURG SCHENECTADY
## 2 3
## SCHERERVILLE SCHERR
## 2 1
## SCHERTZ SCHILLER PARK
## 1 4
## SCHROON LAKE SCIO
## 1 1
## SCIPIO SCITUATE
## 3 1
## SCOTT CITY SCOTTS VALLEY
## 1 1
## SCOTTSBLUFF SCOTTSBORO
## 1 3
## SCOTTSBURG SCOTTSDALE
## 1 26
## SCOTTSVILLE SCRANTON
## 2 3
## SEABROOK SEAGOVILLE
## 2 1
## SEAL BEACH SEALY
## 4 1
## SEAMA SEARCY
## 1 2
## SEATAC SEATTLE
## 3 24
## SEBAGO CENTER SECAUCUS
## 1 4
## SEDALIA SEDAN
## 3 1
## SEDONA SEDRO-WOOLLEY
## 1 1
## SELBYVILLE SELIGMAN
## 1 1
## SELLERSBURG SELLS
## 3 1
## SELMA SELMER
## 2 3
## SEMINOLE SENATOBIA
## 1 1
## SENECA SENNETT
## 2 1
## SENOIA SENTINEL BUTTE
## 1 2
## SEQUIM SEVIER
## 1 1
## SEVIERVILLE SEYMOUR
## 7 6
## SHADY SHORES SHAFTER
## 1 1
## SHAKOPEE SHALLOTTE
## 2 1
## SHAMOKIN SHAMOKIN DAM
## 1 1
## SHANKS SHANNON
## 1 1
## SHARON SHARONVILLE
## 4 3
## SHAWANO SHAWNEE
## 1 2
## SHEBOYGAN SHEFFIELD
## 1 2
## SHELBIANA SHELBURNE
## 2 1
## SHELBY SHELBY GAP
## 5 1
## SHELBYVILLE SHELDON
## 6 1
## SHELTON SHENANDOAH
## 3 1
## SHENANDOAH JUNCTION SHEPHERD
## 2 1
## SHEPHERDSTOWN SHEPHERDSVILLE
## 1 6
## SHERBORN SHERIDAN
## 1 2
## SHERMAN SHERWOOD
## 7 3
## SHILOH SHIPROCK
## 1 2
## SHIPSHEWANA SHIRLEY
## 2 1
## SHIVELY SHORELINE
## 6 3
## SHOREWOOD SHOSHONE
## 1 1
## SHOW LOW SHREVEPORT
## 3 30
## SHREWSBURY SICILY ISLAND
## 3 1
## SIDNEY SIERRA VISTA
## 4 2
## SIGNAL MOUNTAIN SIGURD
## 1 2
## SIKESTON SILERVILLE
## 3 1
## SILOAM SPRINGS SILT
## 2 1
## SILVER CITY SILVER LAKE
## 1 1
## SIMI VALLEY SIMPSONVILLE
## 5 1
## SIMSBURY SINCLAIRVILLE
## 1 1
## SINTON SIOUX CITY
## 1 7
## SIOUX FALLS SISSONVILLE
## 14 3
## SISTER BAY SISTERSVILLE
## 1 2
## SKANEATELES SKIATOOK
## 2 1
## SKOKIE SKOWHEGAN
## 2 4
## SLANESVILLE SLATE HILL
## 2 1
## SLIDELL SLOATSBURG
## 7 1
## SLOCOMB SMACKOVER
## 1 1
## SMITHBURG SMITHFIELD
## 1 8
## SMITHTOWN SMITHVILLE FLATS
## 10 1
## SMYRNA SNELLVILLE
## 12 3
## SNOW HILL SNOWFLAKE
## 1 1
## SNYDER SOCORRO
## 1 2
## SODDY-DAISY SODUS
## 1 3
## SOLANA BEACH SOLDIER
## 2 1
## SOLDOTNA SOMERS
## 1 1
## SOMERS POINT SOMERSET
## 1 2
## SOMERTON SOMERVILLE
## 1 1
## SOMESVILLE SONOMA
## 1 1
## SORRENTO SOUR LAKE
## 1 1
## SOUTH BARRINGTON SOUTH BAY
## 1 1
## SOUTH BELOIT SOUTH BEND
## 1 10
## SOUTH BRUNSWICK SOUTH BURLINGTON
## 5 3
## SOUTH BYFIELD SOUTH CHICAGO HEIGHTS
## 1 1
## SOUTH DAYTONA SOUTH DENNIS
## 1 2
## SOUTH EL MONTE SOUTH GATE
## 1 1
## SOUTH GLENS FALLS SOUTH HADLEY
## 2 1
## SOUTH HAMPTON SOUTH HOLLAND
## 1 2
## SOUTH HOUSTON SOUTH JORDAN
## 1 1
## SOUTH KINGSTOWN SOUTH LAKE TAHOE
## 3 1
## SOUTH LEBANON SOUTH MIAMI
## 1 1
## SOUTH MILWAUKEE SOUTH PLAINFIELD
## 1 1
## SOUTH ROXANA SOUTH SALEM
## 2 1
## SOUTH SALT LAKE SOUTH SAN FRANCISCO
## 3 3
## SOUTH SHAFTSBURY SOUTH WINDSOR
## 1 1
## SOUTHAMPTON SOUTHAVEN
## 8 2
## SOUTHBURY SOUTHERN PINES
## 1 1
## SOUTHFIELD SOUTHGATE
## 5 4
## SOUTHINGTON SOUTHLAKE
## 5 2
## SOUTHOLD SOUTHSIDE
## 3 3
## SOUTHWEST RANCHES SOUTHWICK
## 1 1
## SPALDING SPANISH FORK
## 1 5
## SPARKS SPARTA
## 5 4
## SPARTANBURG SPEEDWAY
## 4 1
## SPENCER SPENCERPORT
## 3 1
## SPIRIT LAKE SPOKANE
## 1 17
## SPOKANE VALLEY SPRAKERS
## 8 1
## SPRING BAY SPRING DALE
## 1 1
## SPRING HILL SPRING VALLEY
## 4 1
## SPRINGDALE SPRINGFIELD
## 13 74
## STAFFORD STAMFORD
## 3 4
## STANCHFIELD STANFORDVILLE
## 1 1
## STANLEY STANTON
## 3 6
## STANVILLE STARKSBORO
## 1 1
## STARKVILLE STATESBORO
## 1 6
## STATESVILLE STATHAM
## 6 3
## STAUNTON STAYTON
## 1 1
## STEBBINS STEELEVILLE
## 1 1
## STEGER STEILACOOM
## 2 1
## STEPHENTOWN STERLING HEIGHTS
## 1 4
## STETSON STEVENSON
## 1 2
## STEWARTSTOWN STILLWATER
## 1 2
## STOCKBRIDGE STOCKDALE
## 4 1
## STOCKTON STONE MOUNTAIN
## 33 2
## STONEWALL STONINGTON
## 1 2
## STONY BROOK STONY CREEK
## 1 2
## STONY POINT STOUGHTON
## 1 3
## STRAFFORD STRATFORD
## 1 3
## STRAWBERRY STREAMWOOD
## 2 1
## STREATOR STREETMAN
## 3 1
## STRINGTOWN STRONGSVILLE
## 1 2
## STROUD STUART
## 4 4
## STURBRIDGE STUTTGART
## 2 1
## SUAMICO SUCHES
## 1 1
## SUFFERN SUFFOLK
## 1 8
## SUGAR GROVE SUGAR LAND
## 1 2
## SUGARLOAF SUITLAND
## 1 1
## SULLIVAN SULLIVAN CITY
## 3 1
## SULPHUR SULPHUR SPRINGS
## 2 2
## SUMMERFIELD SUMMERSVILLE
## 1 2
## SUMMERVILLE SUMMIT
## 1 3
## SUMMITVILLE SUMNER
## 1 4
## SUMTER SUN CITY
## 4 3
## SUN PRAIRIE SUNLAND PARK
## 3 1
## SUNNY ISLES BEACH SUNNYVALE
## 1 7
## SUNRISE SUNSET HILLS
## 16 2
## SUPERIOR SURFSIDE BEACH
## 2 2
## SURPRISE SUSANVILLE
## 10 2
## SUTTER CREEK SUTTON
## 1 1
## SUWANEE SWAIN
## 2 1
## SWANSEA SWANTON
## 4 1
## SWANVILLE SWEET HOME
## 1 2
## SWEETLAND SWEETWATER
## 1 4
## SYCAMORE SYLACAUGA
## 1 2
## SYLVANIA SYRACUSE
## 2 13
## TABERNACLE TACOMA
## 1 15
## TAFT TALKING ROCK
## 1 1
## TALLADEGA TALLAHASSEE
## 4 22
## TALLAPOOSA TALLMADGE
## 2 4
## TALPA TAMARAC
## 1 11
## TAMPA TAOS
## 59 2
## TAPPAHANNOCK TAR HEEL
## 1 1
## TARBORO TARPON SPRINGS
## 1 4
## TARRYTOWN TAVARES
## 7 4
## TAYLOR TAYLORSVILLE
## 6 5
## TCHULA TEANECK
## 1 2
## TEAYS TEHACHAPI
## 1 2
## TELLICO PLAINS TEMECULA
## 1 6
## TEMPE TEMPLE
## 17 11
## TEMPLE TERRACE TENNILLE
## 2 2
## TERRE HAUTE TERRELL
## 5 1
## TERRY TERRYTOWN
## 2 1
## TEXARKANA TEXAS CITY
## 13 8
## THAYER THE COLONY
## 1 1
## THE VILLAGE THE WOODLANDS
## 1 2
## THERESA THIBODAUX
## 1 1
## THOMASTON THOMASVILLE
## 2 2
## THOMPSON THOMSON
## 2 2
## THORNTON THORNVILLE
## 10 1
## THOUSAND OAKS THREE MILE BAY
## 5 1
## THREE RIVERS TIFTON
## 1 1
## TILTON TIMPSON
## 2 1
## TINLEY PARK TINTON FALLS
## 2 1
## TIPP CITY TIPTON
## 1 2
## TIPTONVILLE TITUSVILLE
## 1 5
## TOBYHANNA TOLEDO
## 2 34
## TOLLAND TOLLESON
## 2 1
## TOLONO TOM BEAN
## 1 1
## TOMBALL TOMS RIVER
## 3 5
## TONALEA TONAWANDA
## 1 4
## TONGANOXIE TONOPAH
## 1 3
## TONSINA TOOELE
## 1 1
## TOPEKA TOPSHAM
## 11 1
## TOQUERVILLE TORNILLO
## 1 1
## TORRANCE TORREY
## 7 1
## TOULON TOWN AND COUNTRY
## 2 4
## TOWN OF DIGHTON TOWN OF EASTON
## 1 2
## TOWN OF MACHIASPORT TOWN OF REHOBOTH
## 1 4
## TOWN OF UXBRIDGE TOWNSEND
## 1 1
## TOWNSHIP OF BRICK TOWNSHIP OF BRIDGEWATER
## 3 2
## TOWNSHIP OF CENTER TOWNSHIP OF EWING
## 1 3
## TOWNSHIP OF IRVINGTON TOWNSHIP OF NORTH HUNTINGDON
## 1 1
## TOWNSHIP OF PITTSGROVE TOWNSHIP OF SOUTH ORANGE VILLAGE
## 3 1
## TOWNSHIP OF SOUTHAMPTON TOWNSHIP OF WARREN
## 3 2
## TRACY TRAFFORD
## 7 1
## TRAVERSE CITY TREASURE ISLAND
## 2 1
## TRENTON TRES PIEDRAS
## 10 1
## TRIMBLE TRINITY
## 1 2
## TRION TROMMALD
## 2 1
## TROTWOOD TROUTDALE
## 5 1
## TROY TRUMANSBURG
## 14 1
## TRUMBULL TRUSSVILLE
## 6 2
## TRUTH OR CONSEQUENCES TUBA CITY
## 1 1
## TUBAC TUCKER
## 1 5
## TUCSON TUKWILA
## 116 8
## TULARE TULAROSA
## 7 1
## TULLY TULSA
## 1 56
## TUMACACORI TUMWATER
## 1 2
## TUPELO TURKEY CREEK
## 9 1
## TURLOCK TURNER
## 7 2
## TUSCALOOSA TUSCUMBIA
## 8 1
## TUSKEGEE TUSTIN
## 4 5
## TUTTLE TUXEDO PARK
## 2 2
## TWENTYNINE PALMS TWIN FALLS
## 4 1
## TWIN LAKES TWIN MOUNTAIN
## 1 1
## TWO RIVERS TYBEE ISLAND
## 1 1
## TYE TYLER
## 1 12
## TYNGSBORO TYRO
## 1 1
## UHRICHSVILLE ULYSSES
## 1 2
## UNICOI UNION
## 2 10
## UNION CITY UNION SPRINGS
## 15 3
## UNIONTOWN UNIVERSITY CITY
## 2 1
## UNIVERSITY PARK UNIVERSITY PLACE
## 3 2
## Unknown UPLAND
## 262 6
## UPPER DARBY UPPER HANOVER
## 2 1
## UPPER MERION UPPER TRACT
## 2 1
## URBANA UTICA
## 4 4
## UXBRIDGE VACAVILLE
## 1 3
## VADO VAIL
## 2 2
## VALDOSTA VALLEJO
## 2 9
## VALLEY VALLEY HEAD
## 2 1
## VALLEY VIEW VALPARAISO
## 2 2
## VAN BOWEN VAN BUREN
## 1 2
## VAN VLECK VANCOUVER
## 1 14
## VANDALIA VARDAMAN
## 2 2
## VARNVILLE VASS
## 1 1
## VENICE VENTURA
## 1 10
## VENUS VERBANK
## 1 1
## VERNAL VERNON
## 1 13
## VERO BEACH VERONA
## 3 4
## VERSAILLES VESTAL
## 3 1
## VESTAVIA HILLS VEVAY
## 1 1
## VICTORIA VICTORVILLE
## 4 23
## VIDALIA VIDOR
## 2 7
## VIENNA VILLA PARK
## 5 1
## VILLA RICA VINCENNES
## 2 2
## VINE GROVE VINELAND
## 1 5
## VINEYARD HAVEN VINITA PARK
## 1 2
## VIOLA VIRGIN
## 2 1
## VIRGINIA BEACH VIRGINIA GARDENS
## 25 1
## VISALIA VISTA
## 12 7
## VOLNEY VONORE
## 1 4
## VOORHEES WACO
## 2 14
## WADSWORTH WAGONER
## 1 1
## WAGRAM WAHIAWA
## 1 3
## WAHOO WAIALUA
## 1 2
## WAIKOLOA VILLAGE WAIPAHU
## 1 1
## WAIPI\x91O ACRES WAITE PARK
## 2 1
## WAITSFIELD WAI\x91ANAE
## 1 1
## WAKE FOREST WAKEFIELD
## 1 4
## WALDO WALDORF
## 2 1
## WALDWICK WALES
## 1 1
## WALES CORNER WALKER
## 1 2
## WALKERSVILLE WALKERTOWN
## 1 2
## WALL TOWNSHIP WALLACE
## 3 1
## WALLINGFORD WALLINS CREEK
## 5 1
## WALNUT CREEK WALNUT RIDGE
## 2 1
## WALNUTPORT WALPOLE
## 1 1
## WALSENBURG WALTHAM
## 1 2
## WALTHOURVILLE WALTON
## 1 3
## WAMPUM WANAQUE
## 1 1
## WANSHIP WANTAGE
## 1 1
## WAPPINGER WARE
## 2 1
## WAREHAM WARFIELD
## 5 1
## WARNER WARNER ROBINS
## 1 9
## WARR ACRES WARREN
## 2 9
## WARRENSBURG WARRENSVILLE HEIGHTS
## 1 2
## WARSAW WARWICK
## 2 8
## WASCO WASHINGTON
## 3 38
## WASHINGTON COURT HOUSE WASHINGTON TOWNSHIP
## 1 1
## WASILLA WATAUGA
## 2 1
## WATCHUNG WATER VALLEY
## 2 1
## WATERBURY WATERFORD
## 15 3
## WATERFORD WORKS WATERLOO
## 3 10
## WATERTOWN WATERVILLE
## 5 1
## WATFORD CITY WATSONVILLE
## 1 3
## WAUCEDAH WAUCHULA
## 1 1
## WAUCONDA WAUKEGAN
## 4 10
## WAUKESHA WAUKOMIS
## 4 1
## WAUREGAN WAURIKA
## 1 1
## WAUSAU WAUSEON
## 1 1
## WAUWATOSA WAWARSING
## 2 3
## WAXAHACHIE WAYCROSS
## 5 5
## WAYLAND WAYNE
## 1 14
## WAYNESBORO WAYNESVILLE
## 2 2
## WEATHERFORD WEBBER
## 6 1
## WEBSTER WEEHAWKEN
## 6 1
## WEIMAR WEIRTON
## 1 1
## WELCH WELD
## 2 1
## WELDON WELDON SPRING
## 3 1
## WELLESLEY WELLINGTON
## 1 3
## WELLS WELLSTON
## 2 1
## WELLTON WELSH
## 4 1
## WENDOVER WENTWORTH
## 3 1
## WENTZVILLE WESLACO
## 2 2
## WESLEY WESSON
## 1 1
## WEST ALLIS WEST BRADENTON
## 4 2
## WEST CARROLLTON WEST CHICAGO
## 2 3
## WEST COLUMBIA WEST CONSHOHOCKEN
## 7 1
## WEST COVINA WEST DENNIS
## 9 1
## WEST DEPTFORD WEST DES MOINES
## 1 1
## WEST FRANKFORT WEST GLOCESTER
## 2 2
## WEST GREENWICH WEST HARTFORD
## 2 1
## WEST HAVEN WEST HAZLETON
## 6 1
## WEST JEFFERSON WEST JORDAN
## 1 3
## WEST LEYDEN WEST LINN
## 1 1
## WEST MELBOURNE WEST MEMPHIS
## 2 4
## WEST MIDDLETOWN WEST MILFORD
## 6 3
## WEST MILWAUKEE WEST MONROE
## 1 3
## WEST NEW YORK WEST NEWBURY
## 1 1
## WEST PALM BEACH WEST PLAINS
## 21 2
## WEST POINT WEST SACRAMENTO
## 3 7
## WEST SPRINGFIELD WEST TERRE HAUTE
## 4 2
## WEST TORRINGTON WEST UNIVERSITY PLACE
## 3 1
## WEST VALLEY CITY WEST WARDSBORO
## 10 1
## WEST WARWICK WEST WINDSOR
## 1 1
## WESTAMPTON TOWNSHIP WESTBOROUGH
## 3 3
## WESTBROOK WESTCLIFFE
## 2 1
## WESTERLY WESTERN SPRINGS
## 3 1
## WESTERVILLE WESTFIELD
## 1 5
## WESTFORD WESTHAMPTON
## 1 1
## WESTLAKE WESTLAKE VILLAGE
## 2 1
## WESTLAND WESTMINSTER
## 8 11
## WESTMORELAND WESTON
## 3 4
## WESTPHALIA WESTPORT
## 1 2
## WESTTOWN WESTVILLE
## 1 4
## WESTWEGO WETHERSFIELD
## 1 3
## WETUMPKA WEYMOUTH
## 1 3
## WHARTON WHEAT RIDGE
## 4 6
## WHEATON WHEELER
## 1 1
## WHEELING WHEELOCK
## 6 1
## WHITE WHITE HALL
## 1 2
## WHITE LAKE WHITE OAK
## 1 1
## WHITE SETTLEMENT WHITE SPRINGS
## 1 1
## WHITE SULPHUR SPRINGS WHITEHALL
## 1 2
## WHITESBORO WHITESBURG
## 2 1
## WHITESTOWN WHITEVILLE
## 1 2
## WHITEWRIGHT WHITING
## 1 1
## WHITLEY CITY WHITTIER
## 1 4
## WHY WICHITA
## 2 46
## WICHITA FALLS WICKENBURG
## 5 1
## WICKLIFFE WIGGINS
## 1 1
## WIKIEUP WILBRAHAM
## 2 1
## WILDER WILDOMAR
## 3 3
## WILDWOOD WILKES BARRE TOWNSHIP
## 2 1
## WILKES-BARRE WILLARD
## 3 1
## WILLCOX WILLIAMSBURG
## 2 2
## WILLIAMSON WILLIAMSPORT
## 4 1
## WILLIAMSTOWN WILLINGBORO
## 1 1
## WILLINGTON HILL WILLIS
## 2 1
## WILLISTON WILLISTON PARK
## 2 1
## WILLISVILLE WILLOUGHBY
## 1 2
## WILLOW WILLOW BEACH
## 1 1
## WILLOW SPRINGS WILLOWICK
## 1 1
## WILLOWS WILLS POINT
## 1 1
## WILMER WILMINGTON
## 2 16
## WILMORE WILMOT FLAT
## 1 1
## WILSON WILSONS MILLS
## 9 1
## WILTON WINAMAC
## 1 1
## WINCHESTER WINCHESTER CENTER
## 3 3
## WINDHAM WINDHAM CENTER
## 1 1
## WINDSOR WINFIELD
## 9 2
## WINKELMAN WINNFIELD
## 1 1
## WINNSBORO WINONA
## 2 1
## WINSLOW WINSTON
## 2 1
## WINSTON SALEM WINTER
## 20 1
## WINTER GARDEN WINTER HAVEN
## 1 2
## WINTER PARK WINTERPORT
## 3 1
## WINTERS WINTERSVILLE
## 2 1
## WINTERVILLE WINTHROP
## 1 2
## WISCASSET WISCONSIN RAPIDS
## 1 1
## WIXOM WOLCOTT
## 1 1
## WOLFFORTH WOOD
## 1 1
## WOOD DALE WOOD-RIDGE
## 1 1
## WOODBRIDGE WOODBURY
## 12 4
## WOODINVILLE WOODLAND
## 1 3
## WOODLAND MILLS WOODLAND PARK
## 1 2
## WOODRIDGE WOODSIDE
## 2 2
## WOODSTOCK WOODVILLE
## 10 1
## WOONSOCKET WOOSUNG
## 2 1
## WORCESTER WORTHINGTON
## 6 3
## WRENS WRENTHAM
## 1 1
## WRIGHT CITY WRIGHTSTOWN
## 2 1
## WURTSBORO WYANDOTTE
## 1 1
## WYNANTSKILL WYNNE
## 1 1
## WYOMING WYTHEVILLE
## 10 1
## XENIA YAH-TA-HEY
## 1 1
## YAKIMA YANKTON
## 6 1
## YARDLEY YARMOUTH
## 1 2
## YAZOO CITY YELLOW SPRING
## 1 1
## YONKERS YORK
## 9 4
## YORK VILLAGE YORKSHIRE
## 2 1
## YORKTOWN YORKTOWN HEIGHTS
## 2 3
## YORKVILLE YOUNGSTOWN
## 2 7
## YPSILANTI YUBA CITY
## 1 4
## YUCAIPA YUCCA
## 2 1
## YUCCA VALLEY YUKON
## 4 1
## YUMA ZACHARY
## 16 1
## ZANESVILLE ZEBULON
## 2 1
## ZEPHYRHILLS ZIA PUEBLO
## 2 1
## ZIMMERMAN ZION
## 1 1
## \x91AIEA \x91EWA BEACH
## 4 3
table(datos$STATENAME)
##
## Alabama Alaska Arizona
## 852 53 967
## Arkansas California Colorado
## 585 3558 574
## Connecticut Delaware District of Columbia
## 279 104 34
## Florida Georgia Hawaii
## 3098 1522 81
## Idaho Illinois Indiana
## 188 1087 815
## Iowa Kansas Kentucky
## 304 382 709
## Louisiana Maine Maryland
## 762 151 540
## Massachusetts Michigan Minnesota
## 327 1011 369
## Mississippi Missouri Montana
## 687 914 190
## Nebraska Nevada New Hampshire
## 217 293 98
## New Jersey New Mexico New York
## 547 365 963
## North Carolina North Dakota Ohio
## 1412 96 1154
## Oklahoma Oregon Pennsylvania
## 599 461 1060
## Rhode Island South Carolina South Dakota
## 66 962 132
## Tennessee Texas Utah
## 1119 3520 256
## Vermont Virginia Washington
## 58 796 525
## West Virginia Wisconsin Wyoming
## 249 561 114
names(which.max(table(datos$RUR_URBNAME)))
## [1] "Urban"
names(which.max(table(datos$CITYNAME)))
## [1] "NOT APPLICABLE"
names(which.max(table(datos$STATENAME)))
## [1] "California"
names(which.max(table(datos$NHSNAME))) # La carretera en la que más accidentes se han procudido, es una carretera nacional?
## [1] "This section IS NOT on the NHS"
names(which.max(table(datos$RD_OWNERNAME))) #De quien es la carretera en la que se ha dado el accidente
## [1] "State Highway Agency"
par(mfrow = c(1, 3)) # Dividir la ventana de gráficos en dos
#Ahora graficamos los histogramas
hist(datos$RUR_URB,main = "Histograma de Datos: entornos",
xlab = "Valores",
ylab = "Frecuencia",
col = "skyblue",
border = "black")
hist(datos$CITY,main = "Histograma de Datos: ciudades",
xlab = "Valores",
ylab = "Frecuencia",
col = "green",
border = "black")
hist(datos$STATE,main = "Histograma de Datos, estados",
xlab = "Valores",
ylab = "Frecuencia",
col = "purple",
border = "black")
Como se puede ver por el último output relativo al mayor número de ocurrencias de cada valor dentro de cada variable/coolumna, se infiere como, el mayor número de accidentes se dan en zonas urbanas, que el mayor número de accidentes no se dan en una ciudad en concreto, por lo que podrían y por último, el mayor número de accidentes se dan en el estado de California. Además, se ve como la mayor part de los accidentes se dan en sectores de carreteras que no pertenecen al sistema nacional de autovías pero legalmente pertenece a la agencia estatal de carreteras.
Los histogramas, servirán en el Ejercicio 2 dónde a partir de representciones gráficas se podrán sacar conclusiones e ir “tirando del hilo” hasta poder obtener el conocimiento asociado al objetivo del proyecto de minería de datos.
La siguiente tarea tendría varias fases, y principalmente consistiría en llevar a cabo distintas transformaciones a los datos, con el propósito de darles la forma deseada.
Habiendo estudiado la base de datos algunas de las transformaciones que se podrían llevar a cabo en este fase del proyecto, podrían ser las siguientes:
SIMPLIFICACIÓN DECIMAL: En la base de datos, se especifica la latitud y la longitud. En este caso las dos columnas de valores, tienen muchos decimales, y como se ha visto por teoría y por lo que se infiere por lógica, todos esos decimales requieren de espacio para ser almacenados, por lo tanto cuantos más decimales haya, más espacio necesitará ese valor para almacenarse, por lo tanto esos decimales podrían aproximarse/redondearse hasta cierto punto, ya que todo depende de la exactitud que se necesite, no osbtante, esto no es un problema para el proyeto que se ha propuesto.
En lo que respecta al objetivo del proyecto que se ha propuesto, la latitud y la longitud no aportan mucha información adicional, ya que la base de datos es exclusiva a los EEUU, y además, ya se conoce el estado, la ciudad, y el condado en el que se ha dado el accidente. No obstante, a no ser que este dato se usase para otro proyecto de minería de datos, en el que hubiese una comparación entre los estados de un país y de otro en términos de accidentes, podría descartarse.
Aunque, por precaución este dato no quedaría descartado, porque servería para calcular la media de la latitud y la longitud de cada uno de los accidentes, en el estado en el que más accidentes se producen, esto también podría ayudar a saber con exactitud que punto geográfico concentra más accidentes de media, a partir de ahí se podría trazar un radio en kilómetros que determinase la peligrosidad de la zona. Esto último supondría añadir una variable adicional, algo posible y que se ha estudiado en teoría.
TRANSFORMACIÓN DE ESCALA: Se podrían aplicar transformaciones de escala en el caso de la latitud y de la longitud, ya que poseen valores negativos y positivos que van desde los -90º a +90º y de -180º a +180º correspondientemente, y aunque una comparación entre estos dos atributos no supondría un problema, puede ser que al realizar una gráfica o una comparativa entre una de esas variables y otra del conjunto, pueda dar lugar a confusión.
DATOS NUMÉRICOS A CATEGÓRICOS y AGRUPACIÓN DE VALORES: Se podrían agrupar las latitudes numéricas por latitud; norte y sur y las longitudes también numéricas; oeste y este. pero con el punto 0 en el centro de EEUU, ya que si se tomáse la referencia mundial, llevar a cabo esta transformación sobre estos dos datos no tendría mucho sentido, puesto que EEUU se encuentra en la latitud norte y en longitud oeste.
DIVIDIR EL ATRIBUTO ENTORNO: Por practicidad, parar facilitar la representación gráfica, se podría dividir la variable ENTORNO en dos variables: rural y urbano, así se pasaría de una variable categórica a una variable numérica, así podría ahorrarse más espacio, porque aunque se aumente en una columna la base de datos, cada celda solo contendrá un bit de información, un 0 o un 1.
CREACIÓN DE UN NUEVO ATRIBUTO: Creación del atributo gravedad, que permita clasificar los accidentes por MUY GRAVE-GRAVE-NO MUY GRAVE-LEVE. Aunque crear un atributo no es como tal una transformación de los datos, se me he ocurrido en este momento. Pero esto conecta con un tipo de transformación, la expansión de un atributo. También es verdad que esto daría para otro proyecto de minería de datos, ya que es igual al objetivo de proyecto mencionado al inicio del ejemplo de arriba del todo de esta prueba. Pero como no hay que desarrollar código, el proyecto principal mencionado al principio de este ejercicio podría verse complementado por la introducción de este objetivo de clasificación de accidentes. a pesar de la alta complejidad que ello conllevaría.
Conectando con lo último mencionado y ahora sí, se podrían crear variables nuevas, que cumplan con el objetivo expuesto antes. No obstante, no se me ocurren otras variables que puedan surgir entre el matrimonio de dos ya existentes, porque en términos prácticos y teniendo en cuenta el objetivo del proyecto que se ha especificado, en principio la base de datos ya tiene las variables suficientes como para obtener conocimiento a lo largo pero sobre todo al final del proceso de la minería de datos.
Luego se podrían enriquecer los datos, con datos de otras bases de datos, pero como lo que se quiere estudiar son los estados, los tipos de intersecciones y el entorno en el que se dan los accidentes con un fin preventivo, no tiene mucho sentido añadir datos de otros países, no obstante si hubiese otra base de datos que tuviese datos a nivel nacional (de EEUU) entonces si que habría que tener en cuenta este punto.
La siguiente tarea a tener en cuenta sería la reducción de la dimensionalidad para ello se podrían estudiar los posibles valores que toman las variables, e intentar reducir el área de operación. Esto es importante, ya que como se ha estudiado en teoría, trabajar con menos datos y obtener los mismos resultados que para un conjunto mayor, es mucho mejor, eficientemente hablando.
#Primero se podría calcular la varianza, para ver si hay mucha diversidad en los datos de un atributo en concreto. Luego se graficaría cada una de las variables/atributos por medio de diagramas de dispersión, para estudiar cual es la zona de mayor densidad, y siguiendo el objetivo establecido al inicio de este ejercicio, se podría acotar la zona de trabajo, eliminando accidentes que no cumplan con ciertas características geográficos definidas por los valores que tomen los atributos para cada accidente. Esto nos permitiría detectar los llamados outliers
Esto daría como resultado una base de datos más pequeña, ya que se habrían descartado accidentes puntuales en zonas geográficas. En el próximo paso, una vez se han limpiado los atributos por dentro, se podría hacer una criba más considerable, dando un paso más alla, y eliminando atributos que no vayan a aportar información nueva o relevante. Como ya se mencionó en otros apartados, se podría considerar la eliminación de los atributos de longitud y latitud, en el caso de que estos no arrojen información interesante comparándolos con otros atributos. Luego, podrían extraerse o los nombres de los condados, ciudades o estados, o se podrían extraer los identificadores asociados a dichos nombres para esos tres atributos, esto persigue simplificar aún más el juego de datos. Seguramente sea más eficiente trabajar con números que con cadenas de carácteres, por lo tanto se podría implementar un mapeo entre el nombre de la ciudad/condado/estado con su identificador, para que a la hora de interpretar los resultados gráficos, sea posible ver el nombre de la ciudad/estado/condado y no sus identificadores asociados, ya que estos últimos, por sí solos no aportan información. Pero lo que está, es que los dos representan la misma información pero de diferente manera, por lo tanto uno de ellos se tiene que ir fuera, ya sean los identificadores o los nombres. Este proceso recibe el nombre de selección de atributos y es una fase crítica en el proceso de transformación de datos.
Esto se podría aplicar también al atributo ENTORNO, pues este no aporta información cuando aparece el nombre de una ciudad en el mismo accidente, pues ya se infiere que el accidente se ha dado en un entorno urbano y no rural. En el caso de que el accidente se diese en un entorno rural entonces, en el atributo relativo al nombre de la ciudad, aparecería: NOT APPLICABLE. Volviendo al objetivo de nuestro proyecto de minería de datos y conectando con el análisis que se acaba de hacer, se podrían eliminar muchos más atributos como por ejemplo; DAY_WEEKNAME, así se quedaría solo, el día de la semana, esto es práctico, porque para una persona es muy fácil asignarle el nombre del día al número del día de la semana, esto supondría un ahorro en memoria. Otros ejemplos serían; MONTHNAME,MINUTENAME,NHSNAME, LATITUDENAME,LONGITUDNAME, RELJCT2NAME, WRK_ZONENAME, RAILNAME, SCH_BUSNAME, todos estos atributos cumplen con una condición, y es que son todos atributos binarios, es decir, solo pueden tomar dos palabras como valor, y las palabras que toman normalmente, son YES || NO o repiten aquello que se especifica en su variante númerica pero con palabras, por lo tanto es más eficiente mantener los identificadores numéricos y quitar las variantes de cadenas de caracteres.
En este punto, los datos del conjunto son mejores, porque se ha conseguido eliminar lo innecesario, la tarea que a uno ocuparía ahora sería la del proceso de construcción del modelo.
Comienzo del PROCESO de MINERÍA DE DATOS
En este paso se supone que la base de datos ya está “limpia” y se han eliminado los datos redundantes, erróneos, confusos o incluso se han añadido datos, ya sea a nivel de variables/atributos (columnas en la tabla) o a nivel de valores dentro de los propios atributos ya existentes.
En este paso se elegirá un modelo, dentro del conjunto de modelos posibles que cumplan con las características del objetivo del proyecto de minería.
Inicialmente, antes de estudiar la teoría, yo pensaba que el término; modelo, solo hacía referencia a la herramienta que permite extraer/crear conocimiento a partir una base de datos, y aunque en el fondo esto es así, el término modelo también hace referencia a la orientación que se le quiere dar el proyecto, es decir, está relacionado con el objetivo del proyecto enunciado al principio de este ejercicio. Es pertinente mencionar, que puede que me haya adelantado realizando esta tarea de orientación del proyecto de minería y haya especializado demasiado el proceso del tratamiento de la base de datos, siguiendo el objetivo enunciado. A mi parecer esto tiene una vetaja y una desventaja.
La ventaja reside principalmente en el hecho de que se han ido eliminando atributos/variables e información en general, que se creía prescindible respecto al objetivo. No obstante, esto crea una posible desventaja, y es que puede ser que a lo largo del proyecto se vaya alterando el enfoque inicial que se tenía acerca del objetivo principal del proyecto, lo que se traduciría en una necesidad de datos que se fueron descartando a lo largo del tratamiento y el analísis de la base de datos.
Dicho esto, se comienza con la elección de un posible modelo para el proyecto.
Como ya se mencionó al incio de este ejercicio. El objetivo actual e inicial, consiste en intentar predecir posibles lugares geográficos donde más podrían ocurrir accidentes a partir de un proceso de minería de datos centrado principalmente, en atributos geográficos.
Debido al objetivo principal del proyecto de minería de datos, el tipo de modelo que más se ajusta, es un modelo predcitvo, y por teoría, se sabe que los modelos predictivos, presentan muchas similitudes con el proceso de clasificación, pues al fin y al cabo, clasificar algo equivale a predecir el valor de ese algo dentro de un conjunto limitado de valores. Ahora bien, cuando hay más de dos clases, el proceso de clasificación se entiende como una tarea de predicción que tiene indicar el valor de la etiqueta.
En el caso de este proyecto, se podría predecir que lugares podrían albergar accidentes, estudiando aquellos ya documentados en la base de datos. Este estudio se llevaría a cabo en cada estado del país, y para saber que lugares geográficos podrían albergar futuros accidentes en más alta probabilidad, habría que estudiar y relacionar atributos como, condados, ciudades, entornos, tipos de vias, las intersecciones y sus tipos, etc. Este proceso sería complejo y muy elaborado ya que se tendrían en cuenta muchas clases.
MECÁNICA GENERAL DEL PROCESO DE BÚSQUEDA
El conocimiento a priori (por ejemplo: se sabe que las zonas más pobladas tienen más probabilidad de albergar accidentes, pues que el modelo tenga un enfoque parecido) que se tiene, el estudio de la base de datos que se ha realizado, y el objetivo del proyecto, apuntan a las redes neuronales, como buenas candidatas iniciales para liderar esa extracción del conocimiento. No obstante, habría que evitar el problema de los mínimos locales mencionado en teoría, para ello se tendría que buscar una métrica que permitiése comparar los resultados del entrenamiento de diferentes redes neuronales con un número distinto de capas y en diferentes arquitecturas, para poder determinar que modelo de red neuronal es mejor. La métrica que puede determinar, que modelo es mejor, puede ser el la del valor de pérdidas al final del entrenamiento, ya que aquella arquitectura de red que presente un menor valor de pérdidas al final de su entrenamiento, será la red más adecuada para la extracción del conocimiento en el proyecto de minería de datos
No obstante, hay que tener en cuenta que las redes neuronales, a pesar de presentar un gran potencial a la hora de realizar tareas repetitivas tras su entrenamiento, requieren de una gran cantidad de datos para el entrenamiento, y este además, tiene que ser lo suficientemente largo, como para que la red realice bien la tarea que la ocupa. Por el contrario, si el conjunto de datos de entrenamiento no es suficiente, se podría dar el famoso overfitting en castellano sobre-ajuste. Este fenómeno ocurre cuando el modelo no puede generalizar bien y en cambio se ajusta demasiado a los datos del entrenamiento. Por lo tanto, habría que estudiar si todos los datos que hay en la base de datos son suficientes para entrenar la red que se encarge de clasificar las zonas geográficas que más accidentes puedan tener. Habiendo estudiado en más o menos detalle la base de datos, me he dado cuenta de que hay una gran variedad de accidentes, pues muchos de ellos cuentan con valores muy característicos en sus atributos, esto puede jugar a favor de un buen entrenamiento, ya que no todos los accidentes son iguales, y por ende la red aprendería bien, pero claro, esto la llevará mucho tiempo, y también tiene que haber muchos accidentes dentro de cada tipo de accidente, para que la red tenga un buen ejemplo.
He elegido una red neuronal para este caso, porque se ajusta a las caracteristicas del proyecto de minería, y además hace no mucho realicé my TFG en el campo de la visión por computador, por lo tanto conservo muchas ideas.
Al haber elegido una red neuronal como modelo que acometa el objetivo propuesto hay que tener en cuenta varios aspectos vistos en teoría y muy propios de las redes neuronales, que van a determinar un correcto funcionamiento del mismo:
La función de coste y de pérdidas y funciones de activación: Estas funciones representan cosas diferentes, pero todas son medidas de calidad que califican cada una de las arquitecturas neuronales dentro del mundo de la IA. A continuación se explica muy brevemente la misión de cada una de las funciones: la función de pérdidas es una función de optimización que se busca minimizar, para reducir el error de predicción. Cabe mencionar que el trabajo que realizan las redes neuronales, es el de opimización, estas se dedican a buscar minimos en funciones mediante diferentes maneras, como por ejemplo, mediante el algoritmo del gradient descent. Luego, la función de costes se encarga también de medir el error del modelo, pero en un conjunto de datos, a diferencia de la función de pérdidas que solo maneja una instancia de datos. Estas dos funciones determinan cuanto de bien le está yendo al entrenamiento, y por lo tanto constituyen métricas de calidad que han de utilizarse en el proceso de evaluación del modelo, para saber cuanto de bueno es. Por último, la función de activación se aplica en cada neurona y está se encarga de transformar los datos de entrada que le llegan en características abstractas más separables linealmente. Las funciones de activación determinan directamente el entrenamiento de la red y por consecuente condicionan su aprendizaje.
La tasa de aprendizaje y los pesos: La tasa de aprendizaje y los pesos son hiperparámetros de la red, mientras que la primera se encarga de regular el ritmo al que un algoritmo (e.g., el gradient descent) actualiza o aprende los valores de estimación de un parámetro, los pesos determinan la intensidad de interacción entre cada neurona. Estos dos hiperparámetros, también forma parte del conjunto de métricas de calidad
Umbrales de detección: Permiten saber a la red que resultados descartar y cuales no, en principio estos parámetros suelen modificarse habitualmente al realizar el entrenamiento de una red.
VARIEDAD DE MODELOS DE BÚSQUEDA
Seguramente hayan más funciones y parmámetros que permitan evaluar el modelo escogido, pero creo que las más importanes se han mencionado arriba. Soy consciente que en esta última parte me he centrado mucho en explicar el modelo desde la perspectiva de las redes neuronales, y no tanto desde la minería de datos.
Volviendo al conocimiento a priori que se ha hecho referencia en esta fase del proyecto, hay que saber como integrarlo. Un método que podría ser intersante sería el de las relaciones de coocurrencia ya que permitiría la expresión de dependencia entre dos atributos, en nuestro caso: “siempre que hay un accidente en una ciudad, significa que el entorno del accidente es urbano”. Pensando un poco a lo loco, esto podría especificarse en la red neuronal, modificando los valores de los pesos, para que los altos pesos de una neurona y otra reflejen la alta intensidad de interacción entre ellas justificando así la dependencia de estos dos atributos.
Para mejorar el aprendizaje de la red, es pertinente destacar la gran cualidad enriquecedora que tiene el transferlearning en el campo de las redes neuronales, ya que esto permite reciclar conocimiento de otra tarea, con el fin de que la red no empiece desde 0 y tenga conocimientos “innatos” esto en la práctica se traduce en implementar unos pesos ya entrenados.
Conectando con el último párrafo, y según el conocimiento a priori que se tenga, este proyecto de minería de datos implementaría un método de reutilización del conocimiento extraído por otro sistema de minería de datos, a fin de dirigir mejor la tarea de búsqueda.
Si se tiene en cuenta el tipo de datos el modelo escogido basado en redes neuronales se corresponde efectivamente con un método de minería de datos supervisados ya que la red clasificaría las observaciones asignándoles un valor o una etiqueta. Aplicando esto al modelo que se ha propuesto, basado en una red neuronal, la red analizaría cada uno de los accidentes y los clasificaría dependiendo de si forman o no parte de un lugar geográfico con muchos accidentes.
Por último, teniendo en cuenta el método de construcción del modelo, el método de minería de datos seria de naturaleza batch ya que la red tomaría la base de datos como el único juego de datos posible, ahorrando así en complejidad. Si se fuese ambicioso y a fin de evitar los problemas de la deriva de modelos y datos envejecidos se podría implementar una red basada en el método incremental modificando sus parámetros según cambian los datos en el tiempo.
EVALUACIÓN e INTERPRETACIÓN del modelo
Esta es la penúltima fase del proyecto, y si todo lo anterior ha ido bien, en esta fase ya se tendría un modelo capaz de representar el conocimiento deseado, respondiendo así a la pregunta formulada al inicio de este ejercicio.
Ahora es el momento de evaluar el modelo, para ello habría que evaluar el funcionamiento de la red que se ha propuesto, por lo tanto la siguiente tarea consistiría en poner a prueba el modelo construido formando tres conjuntos de datos de accidentes, un conjunto para su construcción, otro para validar que el modelo funciona y un último conjunto para evaluar el comportamiento del modelo. Por lo tanto, se extraerían tres conjuntos con accidentes variados en cada unos de ellos.
La tarea a realizar ahora, sería la de aplicar un modelo predictivo de machine learning o de IA (por ejemplo) para formar los tres conjuntos de datos. Como el objetivo es predecir zonas geográficas donde se puedan generar nuevos accidentes a partir de otros atributos, como el tipo de via o intersección, se procedería a separar los accidentes en dos bloques, aquellos que se han dado en zonas con una alta densidad de accidentes (zonas de mayor riesgo) y aquellos que se dan en zonas no tan “desafortunadas”. Al primer bloque de datos (accidentes en zonas de mayor riesgo) se le aplicaría el modelo depredictivo mencionado antes, para conocer que accidentes se encuentran en zonas de alta densidad de siniestros y para saber cuales no. Seguidamente, se extraeran las cambinaciones de valores que pronostican la pertenencia a una clase o a otra. Por ejemplo, como se ha visto anteriormente, las zonas de mayor riesgo de accidente, son aquellas en entorno urbano, o interurbano, pues el término que más aparece relativo a las ciudades es: “NO APLICA”, dónde el tramo de carretera donde se ha producido el accidente no suele formar parte del sistema nacional de autopistas pero legalmente ese tramo de accidente suele ser propiedad de la agencia estatal de autopistas. Como este conjunto de características es el que más se repite entre los accidentes, esta regla se podría aplicar sobre el conjunto de datos nuevo para llevar a cabo una predicción.
En esta misma tarea, habría que determinar si se etiquetan correctamente los nuevos accidentes siguiendo la regla anterior, para ello se podría establecer una incertidumbre del 6% por lo tanto si los nuevos accidentes se clasifican con una probabilidad del 94%, entonces el modelo funciona, ya que está clasificando accidentes en zonas de riesgo, como accidentes en zonas de riesgo. No obstante en esta tarea se tendría que tener en cuenta también los falsos positivos, que son los accidentes que se clasifican de riesgo, cuando en realidad no son de riesgo y viceversa con los falsos negativos.
Finalmente, en el caso en el que el modelo funcionase correctamente, habría que interpretar los resultados. Esta es una de las tareas más importantes del proceso de minería de datos, por lo tanto hay que poner mucha atención. En este paso, hay que hacer interpretaciones en profundidad. Aunque no se tienen resultados para poder discutirlos, se puede tomar como ejemplo de interpretación un resultado de un análisis anterior en el que he mencionado que el atributo CITYNAME estaba estrechamente relacionado con el atributo ENTORNO, en ese analisis he llegado a decir que si para algún accidente el nombre de la ciudad es NO APLICA, significa que el entorno dónde ha ocurrido el accidente es rural, pero esto no es veraz, ya que hay accidentes en los que el nombre de la ciuad es “NO APLICA” pero el entorno mencionado es urbano, esto puede parecer una contradicción, pero en el fondo puede que tenga una explicación más profunda. De esto trata este punto del proyecto, de interpretar los resultados, y de entender la relación entre los resultados y el objetivo del proyecto.
Estudiando los términos, se intuye que el conjunto relativo al de la validación del modelo, no debería de ser igual de grande que el conjunto de datos para evaluar el modelo, ya que validar el modelo consistiría solo en comprobar que el modelo funciona, luego evaluarlo, consistirá en comprobar que el modelo funciona a largo plazo y con cualquier tipo de accidentes. No obstante, los tres conjuntos tienen que venir de la misma base de datos.
Ahora bien, para poder determinar si el modelo se ha construido, validado y evaluado correctamente, se precisa de una métrica que permita clasificar cada uno de los tres procesos. Para empezar, lo que se va a hacer va a ser
INTEGRACIÓN DEL MODELO
Esta es la última fase del proyecto, y en ella se llevaría acabo la última tarea del proyecto que consistiría en integrar los resultados del proyecto de minería de datos en el proceso que se encarga de alimentar el modelo que se ah creado con nuevos accidentes, para cumplir con el objetivo del proyecto. Hay que tener en cuenta, que la integración podría suponer un cambio en el código desarrollado, no obstante, gran parte de los sistemas de minería de datos comerciales proporcionan estos servicios.
La última tarea consistiría en conocer cual es el lenguaje de programación en el que se tiene que implementar el modelo, y luego conocer todas las herramientas necesarias para poder realizar esa potencial trauducción de código.
A partir del juego de datos utilizado en el ejemplo de la PEC, realiza las tareas previas a la generación de un modelo de minería de datos explicadas en los módulos “El proceso de minería de datos” y “Preprocesado de los datos y gestión de características”. Puedes utilizar de referencia el ejemplo de la PEC, pero procura cambiar el enfoque y analizar los datos en función de las diferentes dimensiones que presentan los datos. Opcionalmente y valorable se pueden añadir al estudio datos de otros años para realizar comparaciones temporales (https://www.nhtsa.gov/file-downloads?p=nhtsa/downloads/FARS/) o añadir otros hechos a estudiar relacionados, por ejemplo, el consumo de drogas en los accidentes (https://static.nhtsa.gov/nhtsa/downloads/FARS/2020/National/FARS2020NationalCSV.zip)
Escribe aquí la respuesta a la pregunta:
Como en el anterior ejercicio ya se ha propuesto un proyecto de minería de datos, en este ejercicio se llevarán a cabo las tareas previas a la generación de un modelo de minería de datos pero con el foco puesto en el objetivo mencionado en el anterior ejercicio.
# Redacta aquí el código R para el estudio del juego de datos
# Se carga a continuación el fichero de datos
nombre_archivo = 'accident.CSV'
#Ahora se lee el fichero en formato csv
datos <- read.csv(nombre_archivo)
# Se comprueba la estructura del conjunto de datos
structure = str(datos)
## 'data.frame': 35766 obs. of 81 variables:
## $ STATE : int 1 1 1 1 1 1 1 1 1 1 ...
## $ STATENAME : chr "Alabama" "Alabama" "Alabama" "Alabama" ...
## $ ST_CASE : int 10001 10002 10003 10004 10005 10006 10007 10008 10009 10010 ...
## $ VE_TOTAL : int 1 4 2 1 1 2 1 2 2 2 ...
## $ VE_FORMS : int 1 4 2 1 1 2 1 2 2 2 ...
## $ PVH_INVL : int 0 0 0 0 0 0 0 0 0 0 ...
## $ PEDS : int 0 0 0 0 0 0 1 0 0 0 ...
## $ PERSONS : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERMVIT : int 4 6 2 5 1 3 1 2 4 3 ...
## $ PERNOTMVIT : int 0 0 0 0 0 0 1 0 0 0 ...
## $ COUNTY : int 51 73 117 15 37 103 73 25 45 95 ...
## $ COUNTYNAME : chr "ELMORE (51)" "JEFFERSON (73)" "SHELBY (117)" "CALHOUN (15)" ...
## $ CITY : int 0 350 0 0 0 0 330 0 0 1500 ...
## $ CITYNAME : chr "NOT APPLICABLE" "BIRMINGHAM" "NOT APPLICABLE" "NOT APPLICABLE" ...
## $ DAY : int 1 2 2 3 4 4 7 8 9 10 ...
## $ DAYNAME : int 1 2 2 3 4 4 7 8 9 10 ...
## $ MONTH : int 1 1 1 1 1 1 1 1 1 1 ...
## $ MONTHNAME : chr "January" "January" "January" "January" ...
## $ YEAR : int 2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
## $ DAY_WEEK : int 4 5 5 6 7 7 3 4 5 6 ...
## $ DAY_WEEKNAME: chr "Wednesday" "Thursday" "Thursday" "Friday" ...
## $ HOUR : int 2 17 14 15 0 16 19 7 20 10 ...
## $ HOURNAME : chr "2:00am-2:59am" "5:00pm-5:59pm" "2:00pm-2:59pm" "3:00pm-3:59pm" ...
## $ MINUTE : int 58 18 55 20 45 55 23 15 0 2 ...
## $ MINUTENAME : chr "58" "18" "55" "20" ...
## $ NHS : int 0 0 0 0 0 0 0 0 0 1 ...
## $ NHSNAME : chr "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" "This section IS NOT on the NHS" ...
## $ ROUTE : int 4 6 3 4 4 3 4 4 4 2 ...
## $ ROUTENAME : chr "County Road" "Local Street - Municipality" "State Highway" "County Road" ...
## $ TWAY_ID : chr "cr-4" "martin luther king jr dr" "sr-76" "CR-ALEXANDRIA WELLINGTON RD" ...
## $ TWAY_ID2 : chr "" "" "us-280" "" ...
## $ RUR_URB : int 1 2 1 1 1 1 2 1 1 1 ...
## $ RUR_URBNAME : chr "Rural" "Urban" "Rural" "Rural" ...
## $ FUNC_SYS : int 5 4 4 7 5 4 4 5 5 3 ...
## $ FUNC_SYSNAME: chr "Major Collector" "Minor Arterial" "Minor Arterial" "Local" ...
## $ RD_OWNER : int 2 4 1 2 2 1 4 2 2 1 ...
## $ RD_OWNERNAME: chr "County Highway Agency" "City or Municipal Highway Agency" "State Highway Agency" "County Highway Agency" ...
## $ MILEPT : int 0 0 49 0 0 390 0 0 0 3019 ...
## $ MILEPTNAME : chr "None" "None" "49" "None" ...
## $ LATITUDE : num 32.4 33.5 33.3 33.8 32.8 ...
## $ LATITUDENAME: chr "32.43313333" "33.48465833" "33.29994167" "33.79507222" ...
## $ LONGITUD : num -86.1 -86.8 -86.4 -85.9 -86.1 ...
## $ LONGITUDNAME: chr "-86.09485" "-86.83954444" "-86.36964167" "-85.88348611" ...
## $ SP_JUR : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SP_JURNAME : chr "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" ...
## $ HARM_EV : int 42 12 34 42 42 12 8 12 12 12 ...
## $ HARM_EVNAME : chr "Tree (Standing Only)" "Motor Vehicle In-Transport" "Ditch" "Tree (Standing Only)" ...
## $ MAN_COLL : int 0 6 0 0 0 2 0 1 1 2 ...
## $ MAN_COLLNAME: chr "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "Angle" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" ...
## $ RELJCT1 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ RELJCT1NAME : chr "No" "No" "No" "No" ...
## $ RELJCT2 : int 1 1 3 1 1 1 3 1 8 1 ...
## $ RELJCT2NAME : chr "Non-Junction" "Non-Junction" "Intersection-Related" "Non-Junction" ...
## $ TYP_INT : int 1 1 3 1 1 1 2 1 1 1 ...
## $ TYP_INTNAME : chr "Not an Intersection" "Not an Intersection" "T-Intersection" "Not an Intersection" ...
## $ WRK_ZONE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WRK_ZONENAME: chr "None" "None" "None" "None" ...
## $ REL_ROAD : int 4 1 4 4 4 1 1 1 1 1 ...
## $ REL_ROADNAME: chr "On Roadside" "On Roadway" "On Roadside" "On Roadside" ...
## $ LGT_COND : int 2 3 1 1 2 2 3 1 2 1 ...
## $ LGT_CONDNAME: chr "Dark - Not Lighted" "Dark - Lighted" "Daylight" "Daylight" ...
## $ WEATHER : int 1 2 2 10 2 1 1 1 10 10 ...
## $ WEATHERNAME : chr "Clear" "Rain" "Rain" "Cloudy" ...
## $ SCH_BUS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SCH_BUSNAME : chr "No" "No" "No" "No" ...
## $ RAIL : chr "0000000" "0000000" "0000000" "0000000" ...
## $ RAILNAME : chr "Not Applicable" "Not Applicable" "Not Applicable" "Not Applicable" ...
## $ NOT_HOUR : int 99 17 14 99 0 17 19 7 20 10 ...
## $ NOT_HOURNAME: chr "Unknown" "5:00pm-5:59pm" "2:00pm-2:59pm" "Unknown" ...
## $ NOT_MIN : int 99 18 58 99 45 0 23 21 0 3 ...
## $ NOT_MINNAME : chr "Unknown" "18" "58" "Unknown" ...
## $ ARR_HOUR : int 3 17 15 99 0 17 19 7 20 10 ...
## $ ARR_HOURNAME: chr "3:00am-3:59am" "5:00pm-5:59pm" "3:00pm-3:59pm" "Unknown EMS Scene Arrival Hour" ...
## $ ARR_MIN : int 10 26 15 99 55 19 29 28 10 7 ...
## $ ARR_MINNAME : chr "10" "26" "15" "Unknown EMS Scene Arrival Minutes" ...
## $ HOSP_HR : int 99 99 99 99 88 18 88 88 99 10 ...
## $ HOSP_HRNAME : chr "Unknown" "Unknown" "Unknown" "Unknown" ...
## $ HOSP_MN : int 99 99 99 99 88 51 88 88 99 29 ...
## $ HOSP_MNNAME : chr "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" "Unknown EMS Hospital Arrival Time" ...
## $ FATALS : int 3 1 1 1 1 1 1 1 1 1 ...
## $ DRUNK_DR : int 1 0 0 0 0 0 0 0 0 0 ...
Se puede observar como la base de datos tiene 35766 registros y 81 variables. Esto e salgo que ya se conocía del anterior por el pequeño análisis que se realizó, no obstante nunca viene mal comprobar de nuevo las cosas.
Observando el output obtenido antes, puede notarse como la base de datos tiene muchos registros, es decir; muchos accidentes, en este caso hay 35766 accidentes. Cada accidente tiene 81 atributos, que reflejan desde el estado de EEUU en el que se ha producido el accidente, hasta el número de personas implicadas.
Adicionalmente, se ha podido observar en el output anterior, los tipos de variables del dataset, visualmente se podría decir que predominan los atributos de tipo enteros, no obtante tambiñen hay atributos con valores tipo chr, pero como esto no es un razonamiento objetivo, esto se comprueba a continuación:
sapply(datos, class)
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## "integer" "character" "integer" "integer" "integer" "integer"
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## "integer" "integer" "integer" "integer" "integer" "character"
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## "integer" "character" "integer" "integer" "integer" "character"
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## "integer" "integer" "character" "integer" "character" "integer"
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## "character" "integer" "character" "integer" "character" "character"
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## "character" "integer" "character" "integer" "character" "integer"
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## "character" "integer" "character" "numeric" "character" "numeric"
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## "character" "integer" "character" "integer" "character" "integer"
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## "character" "integer" "character" "integer" "character" "integer"
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## "character" "integer" "character" "integer" "character" "integer"
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## "character" "integer" "character" "integer" "character" "character"
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## "character" "integer" "character" "integer" "character" "integer"
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## "character" "integer" "character" "integer" "character" "integer"
## HOSP_MNNAME FATALS DRUNK_DR
## "character" "integer" "integer"
#A continuación hacemos una pequeña gráfica que muestre visualmente:
tipos_de_datos <- function(datos) {
res <- lapply(datos, class)
res_frame <- data.frame(unlist(res))
barplot(table(res_frame), main="Data Types", col="steelblue", ylab="Number of Features")
}
tipos_de_datos(datos)
Como se esperaba, hay más variables enteras que de tipo chr, no obstante, algo que a grandes rasgos no se percibía, era que los atributos LATITUDE y LONGITUDE son variables de tipo NUMERIC, pero esto tiene lógica, porque son valores geográficos decimales y el lenguaje de programación R los llama NUMERIC. Más adelante, se verá si merece la pena o no discretizar estos dos atributos.
Antes de empezar a aplicar las técnicas de preprocesado de datos, habría que familiarizarse con la base de datos. Para ello, se ha estudiado el significado de los atritbutos relativos al archivo accident.csv en el archivo “FARS Analytical Users Manual 1975-2021”. Esta base de datos cuenta con los accidentes que se producieron en el 202. Además, cabe destacar que ya se empezó con el estudio de la base de datos, en el ejercicio anterior anterior, a fin poder proponer el objetivo principal del proyecto de minería de datos.
Teniendo una idea general del significado de los atributos, ahora se procede a la comprobación de variables vacías y nulas en la base de datos, véase la siguiente celda de código:
print('VALORES NULOS')
## [1] "VALORES NULOS"
colSums(is.na(datos))
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 0 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS DRUNK_DR
## 0 0 0
Como se puede comprobar, en lo que respecta a esta base de datos, no habrá que cumplimentar ningun campo, por medio de técnicas ya vistas en teoría como por ejemplo, por medio del cálculo de medias a partir de los valores del mismo atributo, pero para el resto de accidentes. Esto le evitará confusiones futuras al modelo que se desarrolle.
Ahora es el momento de calcular los valores nulos, véase el siguiente código:
print('VALORES VACÍOS')
## [1] "VALORES VACÍOS"
colSums(datos=='')
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 26997 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS DRUNK_DR
## 0 0 0
Como se puede ver arriba, el atributo TWAY_ID2 tiene 26997 celdas vacías, esto significa que para 26997 accidentes, el atrinuto TWAY_ID2 no aporta ninguna información. Este atributo representa el identificador de la vía de circulación. Este atributo registra la vía de circulación en la que se ha producido el accidente y como el objetivo propuesto para el proyecto, es el de saber que zonas geográficas acumulan más accidentes y que las caracterizan, para en un futuro, poder predecir zonas de riesgo de accidente, hay que recordar que este atributo cumple con una característica principal, y es que se trata de un atributo de carácter geográfico, es decir, este atributo da información acerca de la vía en la que se ha producido el accidente, por lo tanto este atributo podría resultar interesante, pero hay que tener en cuenta que falta el 75.48% de los datos de este atributo, por lo tanto va a resultar muy dificil reconstruir todos los valores que faltan y puede ser mu malo para el modelo. No obstante se va a realizar igualmente el estudio.
Primero se buscan los posibles valores que puede tomar este atributo. Por el output de la celda relativa al tipo de datos, puede verse como se trata de un atributo con valores tipo chr. Ahora hay que conocer los valores que puede tomar este atributo, para ello se recurre al pdf que describe los atributos, en él se vé, que como mínimo, los valores de este presentan 10 caractéres, y según los accidentes son más recientes, este atributo puede llegar a a estar formado por cifras de hasta 30 caracteres, por lo tanto resultaría imposible realizar alguna combinación o cálculo de la media para el resto de accidentes, con el fin de poblar las 26997 celdas de este atributo. Cabe destacar que se trata de un atributo de carácter identificativo, no obstante, se representan a continuación sus valores, para verificar la alta variabilidad de datos que puede haber.
Para ello se inspecciona los aspectos del conjunto de valores del atributo TWAY_ID2:
print('información del atributo TWAY_ID2')
## [1] "información del atributo TWAY_ID2"
if (!require('ggplot2')) install.packages('ggplot2'); library('ggplot2')
if(!require('Rmisc')) install.packages('Rmisc'); library('Rmisc')
if(!require('dplyr')) install.packages('dplyr'); library('dplyr')
if(!require('xfun')) install.packages('xfun'); library('xfun')
summary(datos[c("TWAY_ID2")])
## TWAY_ID2
## Length:35766
## Class :character
## Mode :character
head(datos[c("TWAY_ID2")]) #Visuzalizamos las primeras filas
## TWAY_ID2
## 1
## 2
## 3 us-280
## 4
## 5
## 6
tail(datos[c("TWAY_ID2")]) #Visuzalizamos las primeras filas
## TWAY_ID2
## 35761 SR-339
## 35762
## 35763
## 35764
## 35765
## 35766
Como se puede ver en el output de arriba, faltan muchos valores en ese atributo y parece tratarse de valores alfanuméricos, no obstante tras no obtener ninguna información interesante relativa a este atributo, se ha abierto el archivo csv en Excel y se ha estudiado a vista, que valores poblan este atributo, y para sorpresa nuestra, aparecen datos alafanuméricos del estilo ab-xx, donde ab son letras (acrónimos) del tipo de carretera y xx son números, pero también aparecen nombres de calles sin número con varios formatos diferentes. Esta claro que la gran falta de valores de este atributo, y la diversidad de los mismos, hacen imposible la reconstrucción del atributo, por lo tanto, no se va a utilizar para el estudio. Esto signfica que se podría eliminar del data set, y es lo que se hace en la siguiente celda:
drop <- c("TWAY_ID2")
datos = datos[,!(names(datos) %in% drop)]
sort(colnames(datos)) #COMPROBAMOS QUE LO HEMOS ELIMINADO
## [1] "ARR_HOUR" "ARR_HOURNAME" "ARR_MIN" "ARR_MINNAME" "CITY"
## [6] "CITYNAME" "COUNTY" "COUNTYNAME" "DAY" "DAY_WEEK"
## [11] "DAY_WEEKNAME" "DAYNAME" "DRUNK_DR" "FATALS" "FUNC_SYS"
## [16] "FUNC_SYSNAME" "HARM_EV" "HARM_EVNAME" "HOSP_HR" "HOSP_HRNAME"
## [21] "HOSP_MN" "HOSP_MNNAME" "HOUR" "HOURNAME" "LATITUDE"
## [26] "LATITUDENAME" "LGT_COND" "LGT_CONDNAME" "LONGITUD" "LONGITUDNAME"
## [31] "MAN_COLL" "MAN_COLLNAME" "MILEPT" "MILEPTNAME" "MINUTE"
## [36] "MINUTENAME" "MONTH" "MONTHNAME" "NHS" "NHSNAME"
## [41] "NOT_HOUR" "NOT_HOURNAME" "NOT_MIN" "NOT_MINNAME" "PEDS"
## [46] "PERMVIT" "PERNOTMVIT" "PERSONS" "PVH_INVL" "RAIL"
## [51] "RAILNAME" "RD_OWNER" "RD_OWNERNAME" "REL_ROAD" "REL_ROADNAME"
## [56] "RELJCT1" "RELJCT1NAME" "RELJCT2" "RELJCT2NAME" "ROUTE"
## [61] "ROUTENAME" "RUR_URB" "RUR_URBNAME" "SCH_BUS" "SCH_BUSNAME"
## [66] "SP_JUR" "SP_JURNAME" "ST_CASE" "STATE" "STATENAME"
## [71] "TWAY_ID" "TYP_INT" "TYP_INTNAME" "VE_FORMS" "VE_TOTAL"
## [76] "WEATHER" "WEATHERNAME" "WRK_ZONE" "WRK_ZONENAME" "YEAR"
Como se puede ver arriba, ya se ha eliminado ese atributo. Ahora bien, para adelantar las labores de limpieza, lo que se podría hacer en esta misma tarea, sería repetir lo que ya se ha hecho pero para las base de datos relativa a los accidentes ocurridos en el 2019 y en el 2021. Pues a lo largo de este ejercicio, se pretenden llevar a cabo comparaciones. Véase la siguiente celda de código:
print('ACCIDENTES 2019')
## [1] "ACCIDENTES 2019"
nombre_archivo2 = 'accident2019.CSV'
#Ahora se lee el fichero en formato csv
datos2019 <- read.csv(nombre_archivo2)
# Se comprueba la estructura del conjunto de datos para el fichero csv
structure2 = str(datos2019)
## 'data.frame': 33487 obs. of 91 variables:
## $ STATE : int 1 1 1 1 1 1 1 1 1 1 ...
## $ STATENAME : chr "Alabama" "Alabama" "Alabama" "Alabama" ...
## $ ST_CASE : int 10001 10002 10003 10004 10005 10006 10007 10008 10009 10010 ...
## $ VE_TOTAL : int 2 2 3 1 1 2 1 1 1 1 ...
## $ VE_FORMS : int 2 2 3 1 1 2 1 1 1 1 ...
## $ PVH_INVL : int 0 0 0 0 0 0 0 0 0 0 ...
## $ PEDS : int 0 0 0 1 0 0 0 0 0 1 ...
## $ PERSONS : int 3 2 4 1 1 2 5 1 1 1 ...
## $ PERMVIT : int 3 2 4 1 1 2 5 1 1 1 ...
## $ PERNOTMVIT : int 0 0 0 1 0 0 0 0 0 1 ...
## $ COUNTY : int 81 55 29 55 3 85 55 69 3 101 ...
## $ COUNTYNAME : chr "LEE (81)" "ETOWAH (55)" "CLEBURNE (29)" "ETOWAH (55)" ...
## $ CITY : int 2340 1280 0 2562 0 0 0 790 1493 2130 ...
## $ CITYNAME : chr "OPELIKA" "GADSDEN" "NOT APPLICABLE" "RAINBOW CITY" ...
## $ DAY : int 7 23 22 22 18 7 2 9 8 7 ...
## $ DAYNAME : int 7 23 22 22 18 7 2 9 8 7 ...
## $ MONTH : int 2 1 1 1 1 1 1 2 2 2 ...
## $ MONTHNAME : chr "February" "January" "January" "January" ...
## $ YEAR : int 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 ...
## $ DAY_WEEK : int 5 4 3 3 6 2 4 7 6 5 ...
## $ DAY_WEEKNAME: chr "Thursday" "Wednesday" "Tuesday" "Tuesday" ...
## $ HOUR : int 12 18 19 3 5 12 9 21 7 5 ...
## $ HOURNAME : chr "12:00pm-12:59pm" "6:00pm-6:59pm" "7:00pm-7:59pm" "3:00am-3:59am" ...
## $ MINUTE : int 54 3 0 15 50 30 25 2 53 56 ...
## $ MINUTENAME : chr "54" "3" "0" "15" ...
## $ NHS : int 1 1 1 1 1 1 1 0 0 0 ...
## $ NHSNAME : chr "This section IS ON the NHS" "This section IS ON the NHS" "This section IS ON the NHS" "This section IS ON the NHS" ...
## $ ROUTE : int 1 1 1 1 1 1 1 4 6 6 ...
## $ ROUTENAME : chr "Interstate" "Interstate" "Interstate" "Interstate" ...
## $ TWAY_ID : chr "I-85" "I-759" "I-20" "I-59" ...
## $ TWAY_ID2 : chr "" "" "" "" ...
## $ RUR_URB : int 2 2 1 1 2 1 1 1 2 2 ...
## $ RUR_URBNAME : chr "Urban" "Urban" "Rural" "Rural" ...
## $ FUNC_SYS : int 1 1 1 1 1 1 1 7 4 5 ...
## $ FUNC_SYSNAME: chr "Interstate" "Interstate" "Interstate" "Interstate" ...
## $ RD_OWNER : int 1 1 1 1 1 1 1 2 4 4 ...
## $ RD_OWNERNAME: chr "State Highway Agency" "State Highway Agency" "State Highway Agency" "State Highway Agency" ...
## $ MILEPT : int 641 15 2118 1775 413 1567 1826 0 0 0 ...
## $ MILEPTNAME : chr "641" "15" "2118" "1775" ...
## $ LATITUDE : num 32.7 34 33.7 34 30.7 ...
## $ LATITUDENAME: chr "32.66622222" "33.99782778" "33.66084167" "33.95647222" ...
## $ LONGITUD : num -85.3 -86.1 -85.4 -86.1 -87.8 ...
## $ LONGITUDNAME: chr "-85.33665833" "-86.05399722" "-85.39101111" "-86.14052222" ...
## $ SP_JUR : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SP_JURNAME : chr "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" ...
## $ HARM_EV : int 12 12 12 8 1 12 32 1 3 8 ...
## $ HARM_EVNAME : chr "Motor Vehicle In-Transport" "Motor Vehicle In-Transport" "Motor Vehicle In-Transport" "Pedestrian" ...
## $ MAN_COLL : int 1 1 1 0 0 7 0 0 0 0 ...
## $ MAN_COLLNAME: chr "Front-to-Rear" "Front-to-Rear" "Front-to-Rear" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" ...
## $ RELJCT1 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ RELJCT1NAME : chr "No" "No" "No" "No" ...
## $ RELJCT2 : int 1 1 1 1 1 1 1 1 3 1 ...
## $ RELJCT2NAME : chr "Non-Junction" "Non-Junction" "Non-Junction" "Non-Junction" ...
## $ TYP_INT : int 1 1 1 1 1 1 1 1 3 1 ...
## $ TYP_INTNAME : chr "Not an Intersection" "Not an Intersection" "Not an Intersection" "Not an Intersection" ...
## $ WRK_ZONE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WRK_ZONENAME: chr "None" "None" "None" "None" ...
## $ REL_ROAD : int 1 1 1 1 4 1 3 1 4 1 ...
## $ REL_ROADNAME: chr "On Roadway" "On Roadway" "On Roadway" "On Roadway" ...
## $ LGT_COND : int 1 2 2 2 2 1 1 2 1 3 ...
## $ LGT_CONDNAME: chr "Daylight" "Dark - Not Lighted" "Dark - Not Lighted" "Dark - Not Lighted" ...
## $ WEATHER1 : int 1 2 10 1 5 1 10 1 1 1 ...
## $ WEATHER1NAME: chr "Clear" "Rain" "Cloudy" "Clear" ...
## $ WEATHER2 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WEATHER2NAME: chr "No Additional Atmospheric Conditions" "No Additional Atmospheric Conditions" "No Additional Atmospheric Conditions" "No Additional Atmospheric Conditions" ...
## $ WEATHER : int 1 2 10 1 5 1 10 1 1 1 ...
## $ WEATHERNAME : chr "Clear" "Rain" "Cloudy" "Clear" ...
## $ SCH_BUS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SCH_BUSNAME : chr "No" "No" "No" "No" ...
## $ RAIL : chr "0000000" "0000000" "0000000" "0000000" ...
## $ RAILNAME : chr "Not Applicable" "Not Applicable" "Not Applicable" "Not Applicable" ...
## $ NOT_HOUR : int 12 18 19 3 99 12 9 88 7 88 ...
## $ NOT_HOURNAME: chr "12:00pm-12:59pm" "6:00pm-6:59pm" "7:00pm-7:59pm" "3:00am-3:59am" ...
## $ NOT_MIN : int 59 3 2 4 99 30 21 88 53 88 ...
## $ NOT_MINNAME : chr "59" "3" "2" "4" ...
## $ ARR_HOUR : int 13 18 19 3 6 12 9 88 7 88 ...
## $ ARR_HOURNAME: chr "1:00pm-1:59pm" "6:00pm-6:59pm" "7:00pm-7:59pm" "3:00am-3:59am" ...
## $ ARR_MIN : int 9 7 12 11 0 54 24 88 59 88 ...
## $ ARR_MINNAME : chr "9" "7" "12" "11" ...
## $ HOSP_HR : int 13 99 20 88 88 88 99 88 88 88 ...
## $ HOSP_HRNAME : chr "1:00pm-1:59pm" "Unknown" "8:00pm-8:59pm" "Not Applicable (Not Transported)" ...
## $ HOSP_MN : int 27 99 5 88 88 88 99 88 88 88 ...
## $ HOSP_MNNAME : chr "27" "Unknown EMS Hospital Arrival Time" "5" "Not Applicable (Not Transported)" ...
## $ CF1 : int 0 0 14 0 0 0 0 0 0 0 ...
## $ CF1NAME : chr "None" "None" "Motor Vehicle struck by falling cargo,or something that came loose from or something that was set in motion by a vehicle" "None" ...
## $ CF2 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ CF2NAME : chr "None" "None" "None" "None" ...
## $ CF3 : int 0 0 0 0 0 0 0 0 0 0 ...
## $ CF3NAME : chr "None" "None" "None" "None" ...
## $ FATALS : int 1 1 1 1 1 1 1 1 1 1 ...
## $ DRUNK_DR : int 1 0 0 0 1 0 0 1 0 0 ...
En este caso hay 91 variables/atributos frente a las 81 que había en el archivo del 2020. Ahora se comprueban los valores NULOS y los VACÍOS
print('VALORES NULOS 2019')
## [1] "VALORES NULOS 2019"
colSums(is.na(datos2019))
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 0 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER1 WEATHER1NAME WEATHER2 WEATHER2NAME WEATHER
## 0 0 0 0 0 0
## WEATHERNAME SCH_BUS SCH_BUSNAME RAIL RAILNAME NOT_HOUR
## 0 0 0 0 0 0
## NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR ARR_HOURNAME ARR_MIN
## 0 0 0 0 0 0
## ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN HOSP_MNNAME CF1
## 0 0 0 0 0 0
## CF1NAME CF2 CF2NAME CF3 CF3NAME FATALS
## 0 0 0 0 0 0
## DRUNK_DR
## 0
Al igual que en la base de datos del 2020, no hay ningún valor nulo.
print('VALORES VACÍOS 2019')
## [1] "VALORES VACÍOS 2019"
colSums(datos2019=='')
## STATE STATENAME ST_CASE VE_TOTAL VE_FORMS PVH_INVL
## 0 0 0 0 0 0
## PEDS PERSONS PERMVIT PERNOTMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME DAY DAYNAME MONTH MONTHNAME
## 0 0 0 0 0 0
## YEAR DAY_WEEK DAY_WEEKNAME HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME NHS NHSNAME ROUTE ROUTENAME TWAY_ID
## 0 0 0 0 0 0
## TWAY_ID2 RUR_URB RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER
## 24963 0 0 0 0 0
## RD_OWNERNAME MILEPT MILEPTNAME LATITUDE LATITUDENAME LONGITUD
## 0 0 0 0 0 0
## LONGITUDNAME SP_JUR SP_JURNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME WRK_ZONE WRK_ZONENAME REL_ROAD REL_ROADNAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER1 WEATHER1NAME WEATHER2 WEATHER2NAME WEATHER
## 0 0 0 0 0 0
## WEATHERNAME SCH_BUS SCH_BUSNAME RAIL RAILNAME NOT_HOUR
## 0 0 0 0 0 0
## NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR ARR_HOURNAME ARR_MIN
## 0 0 0 0 0 0
## ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN HOSP_MNNAME CF1
## 0 0 0 0 0 0
## CF1NAME CF2 CF2NAME CF3 CF3NAME FATALS
## 0 0 0 0 0 0
## DRUNK_DR
## 0
Al igual que en la base de datos del 2020, solo faltan valores en un solo atributo; el TWAY_ID2, esta gran falta de valores en ese atributo, es lo que ya se ha visto en la base de datos de los accidentes curridos en el 2020.
Ahora se realiza la misma tarea, pero para los accidentes que han ocurrido en 2021
print('ACCIDENTES 2021')
## [1] "ACCIDENTES 2021"
nombre_archivo3 = 'accident2021.CSV'
#Ahora se lee el fichero en formato csv
datos2021 <- read.csv(nombre_archivo3)
# Se comprueba la estructura del conjunto de datos para el fichero csv
structure3 = str(datos2021)
## 'data.frame': 39508 obs. of 80 variables:
## $ STATE : int 1 1 1 1 1 1 1 1 1 1 ...
## $ STATENAME : chr "Alabama" "Alabama" "Alabama" "Alabama" ...
## $ ST_CASE : int 10001 10002 10003 10004 10005 10006 10007 10008 10009 10010 ...
## $ PEDS : int 0 0 1 0 0 0 0 0 0 0 ...
## $ PERNOTMVIT : int 0 0 1 0 0 0 0 0 0 0 ...
## $ VE_TOTAL : int 2 1 1 1 2 3 1 2 1 3 ...
## $ VE_FORMS : int 2 1 1 1 2 3 1 2 1 3 ...
## $ PVH_INVL : int 0 0 0 0 0 0 0 0 0 0 ...
## $ PERSONS : int 3 2 1 1 4 3 1 2 2 3 ...
## $ PERMVIT : int 3 2 1 1 4 3 1 2 2 3 ...
## $ COUNTY : int 115 73 73 117 73 1 83 125 101 73 ...
## $ COUNTYNAME : chr "ST. CLAIR (115)" "JEFFERSON (73)" "JEFFERSON (73)" "SHELBY (117)" ...
## $ CITY : int 0 0 0 0 0 0 0 3050 2130 0 ...
## $ CITYNAME : chr "NOT APPLICABLE" "NOT APPLICABLE" "NOT APPLICABLE" "NOT APPLICABLE" ...
## $ MONTH : int 2 2 2 2 1 1 1 1 1 1 ...
## $ MONTHNAME : chr "February" "February" "February" "February" ...
## $ DAY : int 12 11 7 3 30 28 27 23 17 20 ...
## $ DAYNAME : int 12 11 7 3 30 28 27 23 17 20 ...
## $ DAY_WEEK : int 6 5 1 4 7 5 4 7 1 4 ...
## $ DAY_WEEKNAME: chr "Friday" "Thursday" "Sunday" "Wednesday" ...
## $ YEAR : int 2021 2021 2021 2021 2021 2021 2021 2021 2021 2021 ...
## $ HOUR : int 22 18 0 16 22 12 22 2 0 0 ...
## $ HOURNAME : chr "10:00pm-10:59pm" "6:00pm-6:59pm" "0:00am-0:59am" "4:00pm-4:59pm" ...
## $ MINUTE : int 10 0 20 20 20 15 25 44 32 1 ...
## $ MINUTENAME : chr "10" "0" "20" "20" ...
## $ TWAY_ID : chr "I-20" "I-459" "I-459" "I-65" ...
## $ TWAY_ID2 : chr "" "" "" "" ...
## $ ROUTE : int 1 1 1 1 1 1 1 3 1 1 ...
## $ ROUTENAME : chr "Interstate" "Interstate" "Interstate" "Interstate" ...
## $ RUR_URB : int 2 2 2 2 1 2 1 2 2 2 ...
## $ RUR_URBNAME : chr "Urban" "Urban" "Urban" "Urban" ...
## $ FUNC_SYS : int 1 1 1 1 1 1 1 3 1 1 ...
## $ FUNC_SYSNAME: chr "Interstate" "Interstate" "Interstate" "Interstate" ...
## $ RD_OWNER : int 1 1 1 1 1 1 1 1 1 1 ...
## $ RD_OWNERNAME: chr "State Highway Agency" "State Highway Agency" "State Highway Agency" "State Highway Agency" ...
## $ NHS : int 1 1 1 1 1 1 1 1 1 1 ...
## $ NHSNAME : chr "This section IS ON the NHS" "This section IS ON the NHS" "This section IS ON the NHS" "This section IS ON the NHS" ...
## $ SP_JUR : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SP_JURNAME : chr "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" "No Special Jurisdiction" ...
## $ MILEPT : int 1569 293 183 2300 2820 0 3595 25 20 242 ...
## $ MILEPTNAME : chr "1569" "293" "183" "2300" ...
## $ LATITUDE : num 33.6 33.5 33.4 33.4 33.8 ...
## $ LATITUDENAME: num 33.6 33.5 33.4 33.4 33.8 ...
## $ LONGITUD : num -86.3 -86.6 -86.8 -86.8 -86.8 ...
## $ LONGITUDNAME: num -86.3 -86.6 -86.8 -86.8 -86.8 ...
## $ HARM_EV : int 12 25 8 34 12 12 34 12 1 12 ...
## $ HARM_EVNAME : chr "Motor Vehicle In-Transport" "Concrete Traffic Barrier" "Pedestrian" "Ditch" ...
## $ MAN_COLL : int 2 0 0 0 1 1 0 2 0 6 ...
## $ MAN_COLLNAME: chr "Front-to-Front" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" "The First Harmful Event was Not a Collision with a Motor Vehicle in Transport" ...
## $ RELJCT1 : int 0 0 0 0 0 0 0 0 1 0 ...
## $ RELJCT1NAME : chr "No" "No" "No" "No" ...
## $ RELJCT2 : int 1 1 1 1 1 1 1 2 19 1 ...
## $ RELJCT2NAME : chr "Non-Junction" "Non-Junction" "Non-Junction" "Non-Junction" ...
## $ TYP_INT : int 1 1 1 1 1 1 1 2 1 1 ...
## $ TYP_INTNAME : chr "Not an Intersection" "Not an Intersection" "Not an Intersection" "Not an Intersection" ...
## $ REL_ROAD : int 1 3 2 4 1 1 4 1 8 1 ...
## $ REL_ROADNAME: chr "On Roadway" "On Median" "On Shoulder" "On Roadside" ...
## $ WRK_ZONE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ WRK_ZONENAME: chr "None" "None" "None" "None" ...
## $ LGT_COND : int 2 2 2 1 2 1 2 3 3 2 ...
## $ LGT_CONDNAME: chr "Dark - Not Lighted" "Dark - Not Lighted" "Dark - Not Lighted" "Daylight" ...
## $ WEATHER : int 2 2 2 1 10 1 1 1 1 2 ...
## $ WEATHERNAME : chr "Rain" "Rain" "Rain" "Clear" ...
## $ SCH_BUS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ SCH_BUSNAME : chr "No" "No" "No" "No" ...
## $ RAIL : chr "0000000" "0000000" "0000000" "0000000" ...
## $ RAILNAME : chr "Not Applicable" "Not Applicable" "Not Applicable" "Not Applicable" ...
## $ NOT_HOUR : int 22 99 9 16 22 12 22 2 99 0 ...
## $ NOT_HOURNAME: chr "10:00pm-10:59pm" "Unknown" "9:00am-9:59am" "4:00pm-4:59pm" ...
## $ NOT_MIN : int 13 99 29 20 20 17 30 44 99 1 ...
## $ NOT_MINNAME : chr "13" "Unknown" "29" "20" ...
## $ ARR_HOUR : int 22 19 9 16 22 12 22 2 1 0 ...
## $ ARR_HOURNAME: chr "10:00pm-10:59pm" "7:00pm-7:59pm" "9:00am-9:59am" "4:00pm-4:59pm" ...
## $ ARR_MIN : int 25 9 40 28 30 23 54 51 0 15 ...
## $ ARR_MINNAME : chr "25" "9" "40" "28" ...
## $ HOSP_HR : int 23 88 88 99 88 12 88 88 99 99 ...
## $ HOSP_HRNAME : chr "11:00pm-11:59pm" "Not Applicable (Not Transported)" "Not Applicable (Not Transported)" "Unknown" ...
## $ HOSP_MN : int 2 88 88 99 88 53 88 88 99 99 ...
## $ HOSP_MNNAME : chr "2" "Not Applicable (Not Transported)" "Not Applicable (Not Transported)" "Unknown EMS Hospital Arrival Time" ...
## $ FATALS : int 2 2 1 1 1 1 1 1 1 1 ...
En comparación a las bases del 2019 y el 2020, como se puede ver arriba, la base de datos del 2021 tiene 11 atributos menos que el fichero del 2019 y uno menos que el fichero del 2020. Ahora se comprueban los valores NULOS y los VACÍOS
print('VALORES NULOS 2021')
## [1] "VALORES NULOS 2021"
colSums(is.na(datos2021))
## STATE STATENAME ST_CASE PEDS PERNOTMVIT VE_TOTAL
## 0 0 0 0 0 0
## VE_FORMS PVH_INVL PERSONS PERMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME MONTH MONTHNAME DAY DAYNAME
## 0 0 0 0 0 0
## DAY_WEEK DAY_WEEKNAME YEAR HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME TWAY_ID TWAY_ID2 ROUTE ROUTENAME RUR_URB
## 0 0 0 0 0 0
## RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER RD_OWNERNAME NHS
## 0 0 0 0 0 0
## NHSNAME SP_JUR SP_JURNAME MILEPT MILEPTNAME LATITUDE
## 0 0 0 0 0 0
## LATITUDENAME LONGITUD LONGITUDNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME REL_ROAD REL_ROADNAME WRK_ZONE WRK_ZONENAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS
## 0 0
Ningún valor NULO en ninguno de los atributos, al igual que en los archivos del 2019 y del 2020.
print('VALORES VACÍOS 2021')
## [1] "VALORES VACÍOS 2021"
colSums(datos2021=='')
## STATE STATENAME ST_CASE PEDS PERNOTMVIT VE_TOTAL
## 0 0 0 0 0 0
## VE_FORMS PVH_INVL PERSONS PERMVIT COUNTY COUNTYNAME
## 0 0 0 0 0 0
## CITY CITYNAME MONTH MONTHNAME DAY DAYNAME
## 0 0 0 0 0 0
## DAY_WEEK DAY_WEEKNAME YEAR HOUR HOURNAME MINUTE
## 0 0 0 0 0 0
## MINUTENAME TWAY_ID TWAY_ID2 ROUTE ROUTENAME RUR_URB
## 0 0 29859 0 0 0
## RUR_URBNAME FUNC_SYS FUNC_SYSNAME RD_OWNER RD_OWNERNAME NHS
## 0 0 0 0 0 0
## NHSNAME SP_JUR SP_JURNAME MILEPT MILEPTNAME LATITUDE
## 0 0 0 0 0 0
## LATITUDENAME LONGITUD LONGITUDNAME HARM_EV HARM_EVNAME MAN_COLL
## 0 0 0 0 0 0
## MAN_COLLNAME RELJCT1 RELJCT1NAME RELJCT2 RELJCT2NAME TYP_INT
## 0 0 0 0 0 0
## TYP_INTNAME REL_ROAD REL_ROADNAME WRK_ZONE WRK_ZONENAME LGT_COND
## 0 0 0 0 0 0
## LGT_CONDNAME WEATHER WEATHERNAME SCH_BUS SCH_BUSNAME RAIL
## 0 0 0 0 0 0
## RAILNAME NOT_HOUR NOT_HOURNAME NOT_MIN NOT_MINNAME ARR_HOUR
## 0 0 0 0 0 0
## ARR_HOURNAME ARR_MIN ARR_MINNAME HOSP_HR HOSP_HRNAME HOSP_MN
## 0 0 0 0 0 0
## HOSP_MNNAME FATALS
## 0 0
Como se puede comprobar, el mismo problema que había con el atributo TWAY_ID2 en las dos bases anteriores, se repite también en la base de accidentes del 2021
Como el problema del atributo mencionado también está en las bases del 2019 y del 2021, entonces se procede a eliminar ese atributo de esas dos bases de datos:
# Primero para la base de datos del 2019:
drop2 <- c("TWAY_ID2")
datos2019 = datos2019[,!(names(datos2019) %in% drop2)]
sort(colnames(datos2019)) #COMPROBAMOS QUE LO HEMOS ELIMINADO
## [1] "ARR_HOUR" "ARR_HOURNAME" "ARR_MIN" "ARR_MINNAME" "CF1"
## [6] "CF1NAME" "CF2" "CF2NAME" "CF3" "CF3NAME"
## [11] "CITY" "CITYNAME" "COUNTY" "COUNTYNAME" "DAY"
## [16] "DAY_WEEK" "DAY_WEEKNAME" "DAYNAME" "DRUNK_DR" "FATALS"
## [21] "FUNC_SYS" "FUNC_SYSNAME" "HARM_EV" "HARM_EVNAME" "HOSP_HR"
## [26] "HOSP_HRNAME" "HOSP_MN" "HOSP_MNNAME" "HOUR" "HOURNAME"
## [31] "LATITUDE" "LATITUDENAME" "LGT_COND" "LGT_CONDNAME" "LONGITUD"
## [36] "LONGITUDNAME" "MAN_COLL" "MAN_COLLNAME" "MILEPT" "MILEPTNAME"
## [41] "MINUTE" "MINUTENAME" "MONTH" "MONTHNAME" "NHS"
## [46] "NHSNAME" "NOT_HOUR" "NOT_HOURNAME" "NOT_MIN" "NOT_MINNAME"
## [51] "PEDS" "PERMVIT" "PERNOTMVIT" "PERSONS" "PVH_INVL"
## [56] "RAIL" "RAILNAME" "RD_OWNER" "RD_OWNERNAME" "REL_ROAD"
## [61] "REL_ROADNAME" "RELJCT1" "RELJCT1NAME" "RELJCT2" "RELJCT2NAME"
## [66] "ROUTE" "ROUTENAME" "RUR_URB" "RUR_URBNAME" "SCH_BUS"
## [71] "SCH_BUSNAME" "SP_JUR" "SP_JURNAME" "ST_CASE" "STATE"
## [76] "STATENAME" "TWAY_ID" "TYP_INT" "TYP_INTNAME" "VE_FORMS"
## [81] "VE_TOTAL" "WEATHER" "WEATHER1" "WEATHER1NAME" "WEATHER2"
## [86] "WEATHER2NAME" "WEATHERNAME" "WRK_ZONE" "WRK_ZONENAME" "YEAR"
# Luego para la base de datos del 2019:
datos2021 = datos2021[,!(names(datos2021) %in% drop2)]
sort(colnames(datos2021)) #COMPROBAMOS QUE LO HEMOS ELIMINADO
## [1] "ARR_HOUR" "ARR_HOURNAME" "ARR_MIN" "ARR_MINNAME" "CITY"
## [6] "CITYNAME" "COUNTY" "COUNTYNAME" "DAY" "DAY_WEEK"
## [11] "DAY_WEEKNAME" "DAYNAME" "FATALS" "FUNC_SYS" "FUNC_SYSNAME"
## [16] "HARM_EV" "HARM_EVNAME" "HOSP_HR" "HOSP_HRNAME" "HOSP_MN"
## [21] "HOSP_MNNAME" "HOUR" "HOURNAME" "LATITUDE" "LATITUDENAME"
## [26] "LGT_COND" "LGT_CONDNAME" "LONGITUD" "LONGITUDNAME" "MAN_COLL"
## [31] "MAN_COLLNAME" "MILEPT" "MILEPTNAME" "MINUTE" "MINUTENAME"
## [36] "MONTH" "MONTHNAME" "NHS" "NHSNAME" "NOT_HOUR"
## [41] "NOT_HOURNAME" "NOT_MIN" "NOT_MINNAME" "PEDS" "PERMVIT"
## [46] "PERNOTMVIT" "PERSONS" "PVH_INVL" "RAIL" "RAILNAME"
## [51] "RD_OWNER" "RD_OWNERNAME" "REL_ROAD" "REL_ROADNAME" "RELJCT1"
## [56] "RELJCT1NAME" "RELJCT2" "RELJCT2NAME" "ROUTE" "ROUTENAME"
## [61] "RUR_URB" "RUR_URBNAME" "SCH_BUS" "SCH_BUSNAME" "SP_JUR"
## [66] "SP_JURNAME" "ST_CASE" "STATE" "STATENAME" "TWAY_ID"
## [71] "TYP_INT" "TYP_INTNAME" "VE_FORMS" "VE_TOTAL" "WEATHER"
## [76] "WEATHERNAME" "WRK_ZONE" "WRK_ZONENAME" "YEAR"
Ya se ha eliminado el atributo deseado, ahora el siguiente paso consiste en empezar a gráficar los atributos de interés, para empezar a entender las posibles relaciones entre ellos. Para ello se podría empezar con unos histogramas de los atributos relacionados con lugares o sitios de accidentes:
- COUNTY
- CITY
- NHS
- ROUTE
- RUR_URB
- FUNC_SYS
- RD_OWNER
- LATITUDE
- LONGITUDE
- SP_JUR
- RELJCT1
- RELJCT2
- WRK_ZONE
- TYP_INT
- REL_ROAD
- RAIL
- LGT_COND
- WEATHER
- FATALS
- DRUNK_DR
- SCH_BUS
Estos cinco últimos atributos no son atributos de carácter geográfico, pero se ha creido pertinente resaltarlos para después, poder relacionarlos con los atributos geográficos. Dicho esto, se comienzan a crear histogramas con atributos cuyos conjuntos de valores son menores:
unique(datos["RUR_URB"]) # Para saber cuantos valores posibles hay
## RUR_URB
## 1 1
## 2 2
## 628 6
## 994 9
## 7021 8
unique(datos["WRK_ZONE"])
## WRK_ZONE
## 1 0
## 140 2
## 164 1
## 964 4
## 3838 3
unique(datos["SCH_BUS"])
## SCH_BUS
## 1 0
## 21 1
unique(datos["NHS"])
## NHS
## 1 0
## 10 1
## 994 9
#Contamos cuantas veces aparecen cada una de los posibles valores dentro de cada variable, esto nos dará una idea de dónde se producen más accidentes en cada, entorno, ciudad y estado
table(datos$RUR_URB)
##
## 1 2 6 8 9
## 15033 20233 69 348 83
table(datos$WRK_ZONE)
##
## 0 1 2 3 4
## 34992 432 47 8 287
table(datos$SCH_BUS)
##
## 0 1
## 35715 51
table(datos$NHS)
##
## 0 1 9
## 20308 14763 695
names(which.max(table(datos$RUR_URBNAME)))
## [1] "Urban"
names(which.max(table(datos$WRK_ZONE)))
## [1] "0"
names(which.max(table(datos$SCH_BUS)))
## [1] "0"
names(which.max(table(datos$REL_ROAD))) # La carretera en la que más accidentes se han procudido, es una carretera nacional?
## [1] "1"
names(which.max(table(datos$RELJCT2))) #De quien es la carretera en la que se ha dado el accidente
## [1] "1"
names(which.max(table(datos$ROUTE)))
## [1] "3"
names(which.max(table(datos$RD_OWNERNAME))) #De quien es la carretera en la que se ha dado el accidente
## [1] "State Highway Agency"
par(mfrow = c(1, 3)) # Dividir la ventana de gráficos en tres
#Ahora graficamos los histogramas
hist(datos$RUR_URB,main = "¿RURAL,URBANO,NOT IN INVENTORY,NOT REPORTED?",
xlab = "Valores",
ylab = "Frecuencia",
col = "skyblue",
border = "black")
hist(datos$WRK_ZONE,main = "¿Zona de trabajo?",
xlab = "Valores",
ylab = "Frecuencia",
col = "green",
border = "black")
hist(datos$SCH_BUS,main = "¿AUTOBUS escolar?",
xlab = "Valores",
ylab = "Frecuencia",
col = "purple",
border = "black")
par(mfrow = c(1, 3)) # Dividir la ventana de gráficos en tres
hist(datos$REL_ROAD,main = "¿carretera,mediana,quitamiedos?",
xlab = "Valores",
ylab = "Frecuencia",
col = "skyblue",
border = "black")
hist(datos$RELJCT2,main = "¿Área de intercambio?",
xlab = "Valores",
ylab = "Frecuencia",
col = "green",
border = "black")
hist(datos$ROUTE,main = "SEÑALIZACIÓN DE LA CARRETERA ",
xlab = "Valores",
ylab = "Frecuencia",
col = "purple",
border = "black")
hist(datos$RD_OWNER,main = "¿La carretera de quien es?",
xlab = "Valores",
ylab = "Frecuencia",
col = "yellow",
border = "black")
cat("Varianza atributo RUR_URB: ", var(datos["RUR_URB"]),"\n")
## Varianza atributo RUR_URB: 0.8009664
cat("Varianza atributo WRK_ZONE: ", var(datos["WRK_ZONE"]),"\n")
## Varianza atributo WRK_ZONE: 0.1454882
cat("Varianza atributo SCH_BUS: ", var(datos["SCH_BUS"]),"\n")
## Varianza atributo SCH_BUS: 0.001423942
cat("Varianza atributo REL_ROAD: ", var(datos["REL_ROAD"]),"\n")
## Varianza atributo REL_ROAD: 37.94969
cat("Varianza atributo RELJCT2: ", var(datos["RELJCT2"]),"\n")
## Varianza atributo RELJCT2: 41.06695
cat("Varianza atributo ROUTE: ", var(datos["ROUTE"]),"\n")
## Varianza atributo ROUTE: 5.252901
cat("Varianza atributo RD_OWNER: ", var(datos["RD_OWNER"]),"\n")
## Varianza atributo RD_OWNER: 1416.961
Como se puede observar por los histogramas, el mayor número de accidentes se da en los entornos urbanos (atributo RUR_URB de valor 4), seguido por los entornos rurales (atributo con valor 2). Luego, en términos de obras, practicamente la totalidad de los accidentes se dan en zonas donde no hay obras. Es importante destacar, que afortunadamente, practicamente en la totalidad de los accidentes, los autobuses escolares no se suelen ver envueltos en el accidente. Por lo tanto se podría decir que en la mayoría de entornos donde se dan los accidentes, no hay colegios cerca.
Analizando la segunda tanda de histogramas, en el primero de los tres, se muestra como de nuevo, practicamente la totalidad de los accidentes se dan en “roadway” es decir en la carretera (atributo de valor 1), luego una cantidad muy pequeña de accidentes se reparten entre el árcen y la mediana (valores 2 y 3), por último la infima cantidad restante de accidentes parecen no tener un reporte de la parte de la vía en la que se ha producido el choque. En el segundo histograma se observa como la mayoría de los accidentes no se dan en lugares sin intersecciones, no obstante luego hay una cantidad pequeña de accidentes que se dan en intersecciones o cerca de ellas. En el tercer histograma se observa un comportamiento mucho más variable, en el sentido de que el atributo toma de manera distribuida valores dentro del conjunto posible, de hecho como puede verse por su cálculo de la varianza, tiene una varianza de 5 aproximadamente, en comparación a una varianza de 0 propia de los atributos vistos en la primera tanda de histogramas. En este histograma se observa como los accidentes suelen darse en mayor proporción en las autopistas estatales (atributo con valor 3), a continuación se encuentran las carreteras catalogadas como “U.S. Highway”, luego en calles municipales, seguidamente se encuentran las carreteras condales, luego las interestatales y en el siguiente escalón se encuentran los accidentes que no tienen información de reporte acerca del tipo de vía.
Por último, el histograma en amarillo, representa el número de accidentes en carreteras según la entidad legal a la que pertenezcan la mismas. En dicho histograma puede verse como el mayor número de accidentes se dan en carreteras propiedad de la Agencia Estatal de Autopistas, seguidamente se encuentran una buena parte de accidentes que no tienen este atributo especificado.
Viendo el resultado de los histogramas, de esta fase puede concluirse, que la mayoría de los accidentes se dan en entornos urbanos, en carreteras propiedad de la Agencia Estatal de Autopistas (en carreteras estatales), el choque suele producirse en la misma carretera y no en el quitamiedos o fuera de la misma, y en los accidentes no suelen estar implicados los buses escolares, además los accidentes no suelen darse ni en zonas de obra o cerca de ellas, ni en interesecciones o próximas a ellas. El resultado tiene sentido, ya que cuantas más coches haya, más probabilidad de accidente, por eso el entorno urbano propicia un mayor número de accidentes, no obstante, teniendo esto en cuenta, es curioso ver como el tipo de vias que más aparece en los accidentes se da en las autopistas estatales, y no en calles, por lo tanto hay que profundizar en este campo. Además, el atributo ROUTE es el que presenta un comportamiento diferencial al resto.
Para ello se relaciona el atributo RUR_URB con ROUTE.
par(mfrow = c(1, 2)) # Dividir la ventana de gráficos en tres
datos$carreteras <- ifelse(datos$RUR_URB %in% c(2), 'URBANO', 'RURAL')
counts <- table(datos$carreteras)
barplot(prop.table(counts),col=c("green","grey"), main="Entorno de los accidentes",xlab ="Entorno", ylab = "Porcentaje (%)")
counts <- table(datos$ROUTE)
barplot(prop.table(counts),col=c("green","skyblue","blue","orange","yellow","purple","red","brown","cyan"), main="% de accidentes en cada tipo de vías", ylab = "Porcentaje (%)",names.arg=c("Interstate","U.S.Highway","St.Highway","County Rd","L.St-Township","L.St-Municipal","L.St-Frontage","Other","Unknown"), las = 2)
Como se puede observar, aproximadamente el 55% de los accidentes se dan en un entorno urbano, y un 45% en un entorno rural. Por razones de simplcidad, se han obviado los otros valores del conjunto posible de valores que puede tomar el atributo entorno, porque su repercusión en el porcentaje total es infima. A la derecha se observa el porcentaje de accidentes en cad tipo de vía, y como ya se vió en anteriores gráficos, el mayor número de acccidentes (aproximadamente el 30% del total de los accidentes) se dan en autopistas estatales, seguidamente, el 17% se dan autopistas categroziadas como “US Highway” y en el tercer puesto con un 15% de accidentes, se encuentran las calles locales de municipios.
No obstante, este es el incio del proceso, aún hay que relacionar los atributos entre sí, para poder sacar conclusiones más vinculantes. Ahora se va a relacionar el entorno de los accidentes con los estados en los que se han producido los accidentes, para ello se han seleccionado los estados con mayor población en EEUU.
datosESTADOS=subset(datos, datos$STATENAME == "California" | datos$STATENAME == "Texas" | datos$STATENAME == "Florida" | datos$STATENAME == "New York" | datos$STATENAME == "Pennsylvania")
files=dim(datosESTADOS)[1]
ggplot(data=datosESTADOS[1:files,],aes(x=RUR_URBNAME,fill=STATENAME))+geom_bar()+ggtitle("Relación entre el entorno y el Estado")
Cabe destacar que, hay una gran diferencia entre lso dos entornos, mientras que en el anterior gráfico estaban más cercanos el uno del otro, esto es porque esta vez solo se han seleccionado un grupo de estados en concreto, que además restultan ser los m´sa poblados del país. Por eso se nota esa diferencia.
En los dos entornos principales puede apreciarse el mismo comportamiento jerárquico, el estado que más accidentes tiene es California, luego la Florida, luego Nueva York, seguidamente se encuentra Pennsylvania, y por último Texas. Era de esperar que California fuese el estado con más accidentes, más aun en zonas urbanas, no obstante, el estado de FLorida tiene un mayor número de accidentes que el estado de Texas teniendo en cuenta sus respectivas poblaciones. en 2022 la población de la Florida se estimó en 22,244,823 personas, frente a los 30,029,572 habitantes de Texas, esto implica una diferencia de población de 8 millones de personas, que equivale aproximadamente a la población de la Comunidad de Madrid. El hecho de que Texas tenga “tan pocos accidentes” teniendo en cuenta su población y comparándola con el estado de la FLorida y sus accidentes, precisa de una aclaración, por ello, se va a hacer una comparativa con las otras dos bases de datos, respectivas a los años 2019 y 2021, para ver si este comportamiento se mantiene en el tiempo. Véase la siguiente celda de código:
par(mfrow = c(1, 3)) # Dividir la ventana de gráficos en tres
# ggplot( # begin ggplot!
# mapping = aes(x = datos2019$RUR_URBNAME, fill = datos2019$STATENAME))+
# geom_bar() +
# theme_classic() +
# labs(
# x = "RUR_URB",
# y = "counts"
# )
# BASE DE DATOS DEL 2019
datos2019ESTADOS=subset(datos2019, datos2019$STATENAME == "California" | datos2019$STATENAME == "Texas" | datos2019$STATENAME == "Florida" | datos$STATENAME == "New York" | datos2019$STATENAME == "Pennsylvania")
files=dim(datos2019ESTADOS)[1]
ggplot(data=datos2019ESTADOS[1:files,],aes(x=RUR_URBNAME,fill=STATENAME))+geom_bar()+ggtitle("Relación entre el entorno y el Estado 2019")
# BASE DE DATOS DEL 2020
datosESTADOS=subset(datos, datos$STATENAME == "California" | datos$STATENAME == "Texas" | datos$STATENAME == "Florida" | datos$STATENAME == "New York" | datos$STATENAME == "Pennsylvania")
files2=dim(datosESTADOS)[1]
ggplot(data=datosESTADOS[1:files2,],aes(x=RUR_URBNAME,fill=STATENAME))+geom_bar()+ggtitle("Relación entre el entorno y el Estado 2020")
# BASE DE DATOS DEL 2021
datos2021ESTADOS=subset(datos2021, datos2021$STATENAME == "California" | datos2021$STATENAME == "Texas" | datos2021$STATENAME == "Florida" | datos2021$STATENAME == "New York" | datos2021$STATENAME == "Pennsylvania")
files3=dim(datos2021ESTADOS)[1]
ggplot(data=datos2021ESTADOS[1:files3,],aes(x=RUR_URBNAME,fill=STATENAME))+geom_bar()+ggtitle("Relación entre el entorno y el Estado 2021")
Como se puede comprobar por los resultados de arriba, las bases de datos del 2019 y del 2020 parecen ser idénticas, por ello es pertinente mencionar que se ha comprobado varias veces que se estuviese leyendo el archivo correcto en cada caso. Dicho esto, se observa un aumento en el número de accidentes para el año 2021 en los dos entornos, aunque el comportamiento jerárquico se mantiene constante, siendo California y la Florida los dos estados con más accidentes acumulados.
Para intentar relacionar las variables aún más para sacar más conclusiones de los datos, se va a gráficar las variables de muertes y estado, para el tipo de señalización de la vía (atributo ROUTE) Volveremos a centrarnos en la base de datos del 2020 al no haber encontrado ningúna informacion relevante en las otras dos bases de datos.
ggplot(data = datosESTADOS[1:files2,],aes(x=FATALS,fill=STATENAME))+geom_bar(position="fill")+facet_wrap(~ROUTENAME)+ggtitle("Número de muertes en accidente por Estado y señalización de vía")+labs(x="ENTORNO(1,2,6,8,9)")
Como se puede observar, California es el estado que más porcentaje de muertes acumula en vías cuya señalización se desconoce. Además, se observa como para las vías “Local Street-Frontage Road” el porcentaje de (1,2 y 3) muertes se dispara en el estado de Texas, lo mismo pasa en carreteras de California cuya señalización se desconoce, en este caso, el porcentaje de 1,2,3 y 4 muertes es muy alto. Cabe mencionar que el estado de California, tiene un alto porcentaje de cualquier número de muertes en gran parte del conjunto de vías. Por último, poniendo el foco en las vías señalizadas como “U.S. Highway” el estado de Texas según aumenta el número de muertes, también lo hace el porcentaje de que el accidente sea posible, esto también se observa para el estado de Pennsylvania. Por lo contrario, en el caso del estado de la FLorida, según aumenta el número de muertes, el porcentaje de accidentes se reduce.
Si se estudian las vías señalizadas como “State Highway” se observa algo similar, excepto para el estado de la Florida, pues ahora según aumenta el porcentaje de accidente, el número de muertos aumenta.
A parte de las conclusiones anteriores no se ha podido generalizar ningun comportamiento, por ello, ahora se va a buscar la correlación en función de las muertes y un conjunto de variables de carácter geográfico.
# Utilizamos esta librería para usar la funcio multiplot()
if(!require('Rmisc')) install.packages('Rmisc'); library('Rmisc')
n = c("DRUNK_DR","ROUTE","RUR_URB","RELJCT2","TYP_INT","WRK_ZONE","RD_OWNER","SP_JUR")
accidentDataAux= datos %>% select(all_of(n))
histList2<- vector('list', ncol(accidentDataAux))
for(i in seq_along(accidentDataAux)){
message(i)
histList2[[i]]<-local({
i<-i
col <-log(accidentDataAux[[i]])
ggp<- ggplot(data = accidentDataAux, aes(x = accidentData$FATALS, y=col)) +
geom_point(color = "gray30") + geom_smooth(method = lm,color = "firebrick") +
theme_bw() + xlab("Muertes") + ylab(names(accidentDataAux)[i])
})
}
multiplot(plotlist = histList2, cols = 3)
> >Como se puede observar arriba, la mayoría de tendencias son
negativas, excepto la de los conductores bebidos, pues el número de
muertos aumenta según lo hace el número de conductores alcohólicos. En
el resto de gráficas se observa un comportamiento decreciente, que será
más difícil de estudiar por la cantidad de valores que pueden tomar esos
atributos, no obstante, se hace un pequeño estudio ahora. Y es que para
muchos de estos atributos, el valor 0 (eje y) en cada atributo, suele
determinar que aquello lo que el atributo represente, el valor 0 hace
decrecer el número de víctimas, por lo tanto estamos provando lo
contrario. Esto no es que sea malo, simplemente, lo que nos transmite
esta gráfica es que en las zona donde hay obras o cerca de ellas, en los
entornos rurales, en las zonas sin intersecciones, etc, el número de
muertes decrece.
A continuación se construye la matriz corrplot, para ver en valor numérico las correlaciones:
if(!require("corrplot")) install.packages("corrplot"); library("corrplot")
n = c("FATALS","DRUNK_DR","ROUTE","RUR_URB","RELJCT2","TYP_INT","WRK_ZONE","RD_OWNER","SP_JUR")
factores= datos %>% select(all_of(n))
res<-cor(factores)
corrplot(res,method="color",tl.col="black", tl.srt=30, order = "AOE",
number.cex=0.75,sig.level = 0.01, addCoef.col = "black")
Como se puede observar hay una correlación considerable entre el atributo TYP_INT y RELJCT2, esto tiene sentido porque son dos atributos que representan el tipo de intersección y si cerca o en el lugar del accidente había una intersección. Luego, se observa una correlación del 0.51 entre RD_OWNER y ROUTE, esto era de esperar también, puesto que el atributo RD_OWNER representa la entidad legal de quien es propiedad la carretera, y el atributo ROUTE identifica el tipo de señalización de la carretera del accidente.
Aunque la correlación de TYP_INT y RELJCT2 no es el del 90%, se es consciente de que no aportan demasiada información por seaparado, por lo tanto se va a eliminar uno de ellos. El criterio de eliminación de un atributo es el mismo que se ha visto en teoría, y es que, hay que eliminar el atributo que menos relación guarde con el objetivo principal del proyecto. Como el objetivo del proyecto era el de la identificación de las zonas de carreteras, estados, entornos, tipos de vías, etc dónde más accidentes se producen, es decir la identificación de atribiutos geográficos que más accidentes acumulan, para en un futuro poder prevenir accidentes con ayuda de un modelo de IA/ML. Como el atributo TYP_INT solo se centra en el tipo de intersección, mientras que el atributo RELJCT2 identifica la zona del accidente respecto a la presencia o proximidad de elementos típicos de cruces, salidas, avenidas, etc, se va a proceder a eliminar el atributo TYP_INT.
drop <- c("TYP_INT","TYP_INTNAME")
datos = datos[,!(names(datos) %in% drop)]
sort(colnames(datos)) #COMPROBAMOS QUE LO HEMOS ELIMINADO
## [1] "ARR_HOUR" "ARR_HOURNAME" "ARR_MIN" "ARR_MINNAME" "carreteras"
## [6] "CITY" "CITYNAME" "COUNTY" "COUNTYNAME" "DAY"
## [11] "DAY_WEEK" "DAY_WEEKNAME" "DAYNAME" "DRUNK_DR" "FATALS"
## [16] "FUNC_SYS" "FUNC_SYSNAME" "HARM_EV" "HARM_EVNAME" "HOSP_HR"
## [21] "HOSP_HRNAME" "HOSP_MN" "HOSP_MNNAME" "HOUR" "HOURNAME"
## [26] "LATITUDE" "LATITUDENAME" "LGT_COND" "LGT_CONDNAME" "LONGITUD"
## [31] "LONGITUDNAME" "MAN_COLL" "MAN_COLLNAME" "MILEPT" "MILEPTNAME"
## [36] "MINUTE" "MINUTENAME" "MONTH" "MONTHNAME" "NHS"
## [41] "NHSNAME" "NOT_HOUR" "NOT_HOURNAME" "NOT_MIN" "NOT_MINNAME"
## [46] "PEDS" "PERMVIT" "PERNOTMVIT" "PERSONS" "PVH_INVL"
## [51] "RAIL" "RAILNAME" "RD_OWNER" "RD_OWNERNAME" "REL_ROAD"
## [56] "REL_ROADNAME" "RELJCT1" "RELJCT1NAME" "RELJCT2" "RELJCT2NAME"
## [61] "ROUTE" "ROUTENAME" "RUR_URB" "RUR_URBNAME" "SCH_BUS"
## [66] "SCH_BUSNAME" "SP_JUR" "SP_JURNAME" "ST_CASE" "STATE"
## [71] "STATENAME" "TWAY_ID" "VE_FORMS" "VE_TOTAL" "WEATHER"
## [76] "WEATHERNAME" "WRK_ZONE" "WRK_ZONENAME" "YEAR"
Anteriormente, se vió como los entornos de los accidentes predominantemente, eran dos; RURAL y URBANO, no obstante, el atributo entorno, podría tomar hasta 5 valores. Por lo tanto lo que se va a hacer ahora, va a ser CODIFICAR con un cada vez que un accidente se de en un entorno urbano y en 0 cuando se de en un entorno rural.
INTERPRETACIÓN DE LOS RESULTADOS
Por los útlimos datos que se han estudiado, se podria decir que el estado de California, es el estado que más muertes acumula en cualquier tipo de vía. Estudiando los datos del estado de Texas, a pesar de población, es el estado que menos accidentes suele registrar (dentro del conjunto de estados que se ha estudiado)
Finalmente, a modo de reflexión, creo que a lo largo del desarollo de este proyecto, he sufrido de lo llamado como parálisis por análisis, pues he querido buscar un buen objetivo, y a la hora de analizar los resultados, al haber tantos datos y atributos, he colapsado, olvidando así, ideas interesantes para relacionar atributos y perdiendo de vista el objetivo.